北汽研究总院:智驭未来——智能座舱结合AI技术的探索与实践

栏目:滚动   作者:宋元明清   发布时间:2024-04-22 18:08   阅读量:14499   

公开数据显示,目前我国已有超过19个语言大模型研发厂商,其中15家厂商的模型产品已经通过备案。据预测,2023年我国语言大模型市场规模已达到132.3亿元,增长率已达到110%,市场规模实现较快提升,应用场景不断丰富。

2024年4月18日,在第二届汽车人工智能大会上,北京汽车研究总院有限公司智能座舱总师赵亨利坦言:“AI对于效率的提升,将融入到各行各业的每个角落。”

Al大模型对智能汽车有哪些影响?赵亨利认为,首先AI大模型将助力智能汽车更好的理解传统车控意图;其次基于AI大模型,将不断提升驾驶安全性、优化用户体验、提升座舱舒适性;最后汽车作为场景和功能的集合体,AI大模型将助力“第三生活空间”的建立。

北京汽车研究总院有限公司 智能座舱总师

以下为演讲内容整理:

大模型技术发展概况

经过数年的演进,大模型的发展已经历从最初的专家系统到多领域单体智能的蜕变。至2023年,经过显著的技术突破,包括参数量与数据量的显著增长,以及算力逐步累积带来的智慧涌现,大模型的发展达到了新的高度。2023年,从ChatGPT 4到Sora模型的陆续推出,不仅为公众提供了丰富的话题,也为各行各业带来了前所未有的挑战与机遇。生成式AI的技术进步,吸引了国内外众多行业的瞩目,我国亦在此领域保持着持续的关注。

图源:北汽研究总院

总体来看,技术发展以美国为引领,我国虽在某些方面存在短板,但凭借丰富的开源算法和模型资源,在应用开发层面正逐步追赶国际先进水平。由于某些国外先进算法的使用受限,我们不得不自力更生,开展自主研发。

据工业和信息化部赛迪研究院的调研数据显示,目前我国已有超过19家大语言模型厂商完成备案,2023年大语言模型市场规模已突破百亿,增长率显著,市场潜力巨大。各厂商通过不断整合应用,将自身业务融入大模型之中,预示着其发展的辉煌前景。AI技术的融入将极大地提升各行各业的效率,涵盖医疗、教育、金融、智慧交通、零售与电商、娱乐及安全等多个领域。在医疗领域,AI辅助医生进行更精准的诊疗,提升治疗效果;在教育领域,它能提供更具针对性的教学方案;在金融行业,大模型通过风险与收益分析,帮助规避风险,实现更高收益。

AI大模型对于智能汽车的影响

对于汽车行业而言,大模型的引入将带来深远影响。它能够更深刻地理解用户意图,提供智能化的解决方案,并与汽车控制系统联动,实现从单体智能到更高级别的智慧化转变。通过大模型,汽车将不再局限于简单的命令执行,而是能够与用户进行更自然的交互,理解并回应各种句式和语境。同时,大模型还能提升驾驶安全性,通过路况、车况及人员状态的分析,为用户提供更安全的驾驶方案。

图源:北汽研究总院

在反馈执行层面,大模型将与汽车硬件紧密配合,通过座椅、空调、屏幕、声音等设备的智能控制,提升驾乘体验。未来的汽车将不再是功能的简单罗列,而是成为多模态交互的智慧化系统,为用户提供更舒适、更安全、更智慧的出行体验。

此外,随着科技的不断发展,大模型将与外部世界和家居IoT等领域深度融合,形成智慧的第三空间。通过大模型的涵盖,家电、家居等设备将实现智能化联动,为用户提供更加便捷、高效的生活体验。作为汽车行业的从业者,我们将以车为节点,与智慧的第三空间实现联动,为用户提供适时的服务,实现更加完善的智能化出行。

对于汽车而言,需要主观地判断用户的需求场景空间,通过软件和硬件等资源的协同配合,实现预先设定的功能。近年来,汽车行业热衷于探讨出行场景和小憩模式等创新概念,这些大多基于车厂主观或预先设定的场景。然而,关于实际使用的数据量,我们并未获得详尽的信息,但这一方向无疑是正确的。因此,我们推出了可编程座舱的概念,即不再局限于车厂提供的固定场景,而是将权限开放给用户,让他们根据自己的需求进行编程,形成个性化的场景空间。无论是调整空调温度还是定制座椅样式,用户都能实现有限的控制权。

这一目标的实现,依赖于汽车本身的SOA化,以发挥更多的功能和效率。在此基础上,我们进一步提出了主题空间的概念,这是一种非固态的、灵活多变的空间形态。通过汽车的硬件算力、网络通信能力以及大数据的加持,结合软件技术,我们塑造出汽车的整体主题灵魂。用户同样可以参与编辑,车厂不再过多干预车辆的使用方式。我们推出的可能是一台通用化的硬件,具备部分预制功能,其余则由用户自主控制。

以雾霾天气为例,当雾霾即将来临时,我们的系统会自动推送雾霾模式,将外循环改为内循环,关闭车窗,调节氛围灯和空气净化器至最大档位。这种智能化的响应让用户感受到汽车的聪明与贴心,无需再手动操作。

北汽大模型技术的应用及思考

北汽集团在大模型技术的应用方面进行了大量工作,深知大模型的核心在于算力、数据和算法。在我们的应用中,算力、数据和应用构成了三大核心要素。我们已建成大规模的超算中心,每个车厂都拥有海量的数据资源。我们建立了标准化的、安全的数据管理体系,并与众多合作伙伴共同构建了生态系统。

图源:北汽研究总院

通过大模型的算法接口,我们已经具备了大模型的训练能力,并成功构建了插拔式大模型平台。无论是ChatGPT还是Sora,它们目前尚未实现通用化的人工智能,无法应对所有任务。因此,我们致力于构建插拔式平台,根据需求插入相应的功能模块。我们实现了车云算力的协同一体化,利用边缘计算技术,使车辆也具备一定的算力能力。在数据方面,我们建立了云存储和大模型数据系统,同时面临着隐私和法律法规的挑战。例如,中国现有的法规要求显示终端对其显示内容负责,这要求我们对敏感信息进行严格过滤,以避免生成不适宜的内容推送给用户。

最初,我们通过场景化的落地方式,利用大模型推荐生成场景,并通过微调与评测体系进行优化。这是北汽集团在几个关键方面所做的工作。我们构建了一个名为”百模汇创“的整体平台架构,以大模型为底层支撑,涵盖了北汽的智算中心、大数据分析平台、工具链以及大模型隐私保护系统。在上层,我们改进了大模型的引擎层,利用基座大模型的能力,形成了北汽自己的产品和技术能力,包括多模态感知大模型和多模态生成大模型。在中间层,我们有垂域大模型,包括质控、场景生成和意图理解的百模创汇平台。最终,我们生成了大模型的场景和应用,涉及车控、智驾等多个方面。

这一理念的核心在于通过组合不同的模型,充分发挥各模型的特长,实现万物的感知。简而言之,我们将生态和汽车能力进行原子化组合,通过大模型的规划能力进行调度,以满足用户的实际需求。我们智慧地感知用户需求,并给予智能化的反馈。无论是车端能力、第三方资讯还是外部生态的预约,都可以在大模型的调度下,在合适的时间推送给合适的人。这将为车生活带来更加便捷和智能的体验。

大模型本身只是一个智慧大脑,类似于科幻故事中的三体存在。要使其发挥作用,必须不断地喂数据,使其变得更加聪明。同时,我们还需要引入生态和汽车的基础原子化能力等资源。这样的生态系统融入大模型将带来诸多好处,如无需频繁切换应用,通过接口调用APP生态基础能力进行深层次的组合。如果实施得当,将为用户带来更好的体验。北汽集团将分为三个平台进行推广:一是通过大模型改善现有基础上的语音对话能力,使对话更加流畅和智能;二是通过插拔式的大模型场景及平台,接入不同类型的大模型,实现智能调度,充分理解和反馈生态资源和用户场景。

关于大模型产品3.0的构想,旨在破除生态孤岛,实现去APP化,并以智能化的形象进行深度交互。人们往往更倾向于有形、可感的交互体验,因此,数字人助理可以设计成可爱的小考拉、俏皮的小狐狸,甚至是定制化的个性化形象。这一形象将与大模型在后台实现深度联动,包括表情、动作、情绪等方面的协调,实现场景的无缝对接。这样的设计将使得汽车交互更具实体感,从而增强用户的喜爱度。

在纵向上,我们致力于利用大模型能力实现智慧升级;在横向上,则通过智能场景的重构、形态的革新以及第三空间的增强,来提升用户体验。而硬件能力的提升,正是通过纵横坐标的交叉融合得以实现,从而完成对用户情感共鸣和沉浸感的增强,更深入地洞察用户意图,并据此提供积极、智能化的反馈。

对于大模型的应用展望,其核心地位不言而喻。任何技术的实现都离不开硬件的支持,包括硬件平台的搭建、接口设计以及整个硬件体系的构建。在此基础上,软件层面如操作系统、应用层、驱动层等亦需完善。我们需配备相应的智能化辅助系统,通过数据与生态的喂养,使AI成为处理用户与座舱交互的核心。我们的终极目标,是实现与传统座舱在功能和体验上的全面智慧性升级。

打造未来座舱的思路,可概括为集成、协同与跨界。这意味着我们需与合作伙伴,特别是战略合作伙伴,紧密合作,共同构建完整的体系。通过AI的赋能,我们将实现车内硬件在视觉、听觉、触觉、嗅觉等多方面的场景交互,为用户提供更加智能、亲切、愉悦的驾乘体验。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

最新内容

热点内容

顶尖经济网 | 网站地图 | RSS订阅 | 联系我们