蓝鲸新闻4月29日讯(记者 陈业 李卓玲)“从汽车智能化发展角度而言,目前还处在一个快速上升、演进、变化的时间点,远没有达到瓶颈。”
前述言论来自蓝鲸汽车日前与商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚的对话。作为“AI四小龙”商汤科技于2021年发布的智能汽车品牌,绝影旗下产品线覆盖驾驶、座舱、云端三大模块。
近日,商汤绝影也携系列生成式AI汽车新品亮相上海车展,其中,在驾驶辅助方面,其展示了以VLAR技术架构为核心的生成式智能辅助驾驶R-UniAD技术方案,宣称能突破现阶段端到端范式下数据、安全和性能的三大瓶颈,将实采场景数据的需求降低两个数量级;其世界模型“绝影开悟”升级为2.0版本,进化为近实时在线交互的4D世界模型。面向智能座舱,商汤绝影则首发专为车载AIOS打造的AI内核“绝影千机”。
那么,绝影旗下驾、舱、云三大板块谁是未来?王晓刚表示,“驾”未来的营收贡献或更多,但从长远来看,这三大板块并非孤立发展,会形成一个联合的业务模式。“我们要把汽车的智能化当做整体来看。因为伴随智能辅助驾驶的发展,其应用的安全性更高,覆盖的场景更多,接着还要跟座舱里面的这种体验相结合,即‘舱驾融合’。”
据官方数据显示,截至2024年底,商汤绝影已与超30家国内外车企达成合作,覆盖130余款车型,量产交付累计360万辆。其中,在辅助驾驶领域,其量产方案已合作4家车企,上车7款车型,目前,其也正与东风合作推动UniAD一段式端到端方案的量产落地。
值得关注的是,去年12月,商汤宣布完成战略组织架构重组,建立了“1+X”架构。其中,“1”指生成式AI相关业务,包括提供算力的“大装置”、AI基础模型和应用;“X”则代表生态企业矩阵,包括智能汽车“绝影”、家庭机器人“元萝卜”等。被蓝鲸汽车问及后续绝影会否独立融资时,王晓刚予以肯定的答复,但坦言具体时间表还不方便透露。
商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚
以下为蓝鲸汽车与商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚的对话内容(经删改整理):
驾驶辅助未来营收占比将更高,绝影后续有独立融资计划
Q:了解到商汤绝影其实是有三大板块的,驾-舱-云,你觉得哪一块会是未来?
王晓刚:现在都差不多。将来如果从收入的角度来说,智能辅助驾驶可能会再多一些。不过,我觉得这三个不是一个孤立的体现,会形成一个联合的业务模式。比如说我们提供的世界模型也是智能辅助驾驶非常关键的一部分,但它是部署在云端的。别人在用我们的世界模型时,可能用的是我们的云服务。再者,座舱里面各种大模型的应用,可能也会落到我们的云上,所以这几个里面它是一个融合的状态。
Q:商汤绝影后续有否独立融资规划?具体时间表是如何?
王晓刚:有的。商汤采取的是“1+X”战略,“1”就是大模型等,“X”代表绝影等板块。所以后续绝影是有独立融资规划的。
Q:能否谈谈此次与东风的合作?
王晓刚:我们跟东风的合作,本身就是非常难能可贵的。比如说目前我们看到智能辅助驾驶,其在端侧、车端的开发量逐渐在变少,在云端的开发量实际上在变多,这里面依托的就是一个比较强的基础设施。从2019年开始,我们就在上海建立AIDC数据中心的基础设施,这是我们的优势。
另一方面,车企比如说东风,它有天然接近于客户,能得到客户反馈(数据)等优势。我们一起把算法和基础设施相结合,铺设打好数据的一个管线,将来能够不断地从终端用户方面得到体验反馈,驱动整个智能辅助驾驶体验的迭代。
DeepSeek的成功在于强化学习,但它仍离不开较强的仿真环境
Q:目前大模型在整个汽车行业的应用现状如何?后续走向为何?
王晓刚:大模型赋能智能汽车还在一个快速的发展阶段,无论是从产品体验,还是说从技术架构,还是能够有一个快速的升级。我们去年说的是“端到端”的智能辅助驾驶,今年在这个基础上又往前走了一步:世界模型、模拟仿真。
目前大家对智能辅助驾驶的安全性特别关注,模拟仿真就可以让我们反复重现同一个场景,并且去泛化到其他的场景里面去,能够让安全边界更有确定性,而且能够去赶上,甚至超越人的驾驶水平。
座舱的话,也可以看到大模型的这些能力,包括DeepSeek出现之后,它具有的深度思考和推理能力。去年,我们希望说每一台车有一个有趣的灵魂。所谓这个有趣,它就是建立在一个深度思考的基础之上。所以这里面也给我们进行座舱各种产品体验提升打开非常大的一个空间,包括舱驾的融合。当然,也可以说为了更有安全性。我们对驾驶员的状态要求会更高,比如是不是适合驾驶,以及驾驶员的3D视线到底是注视车外的哪些目标等,这些我们都能够通过AI去做到。所以,当有危险场景逼近的时候,如果驾驶员的注意力不集中,我们背后的 AI系统大模型就能够明确地捕捉到,并采取补救的措施。
Q:之前商汤绝影提出过把强化学习引入到端到端智能辅助驾驶训练中,这个思路是受到DeepSeek的启发吗?您也提到过强化学习需要配合强大的世界模型,这背后有什么样的标准?
王晓刚:DeepSeek的成功是通过强化学习产生了原来超越人类的知识库,我觉得除了有解题的答案,它会产生各种解题的思路,但是它离不开比较强的仿真的环境,和我们所说的世界模型。
比如我们跟东风合作“端到端”,这里面并不是对立和矛盾的,实际上是技术在研究过程中不断给我们补充,通过强化学习、世界模型,让我们“端到端”的模型更加强大。
我们对世界模型的要求还是非常高的。比如我们有11个摄像头,这里面要做到时空的一致性,生成的东西必然要是符合交通法则和各种物理规律等。如果说有的摄像头里面是一个实线,在其他的摄像头里面变成了虚实线,它时空不一致,把这些数据加入到我们的量产训练过程当中,它是会产生各种问题和退化的。所以在这个过程里,量产的团队会对我们的世界模型提出各种要求,保证时空一致性和真实性。
另外就是多样性和复杂性,你不能说只在单一一辆车去模拟各种情况,你要仿真各种不同类型的车。目前对于仿真的要求,不是说在正常的一些交通场景下的数据,这些数据大家已经采的是很多了,要求的是各种复杂极端的交通场景,比如像马上快要发生碰撞等场景。
数据对场景多样性而言仍非常重要
Q:我们一直在强调仿真,那是否意味着以后数据是没有用的?
王晓刚:数据还是很重要。数据的重要点在什么地方?比如说DeepSeek,DeepSeek产生了很多没有出现过的数据,它在什么过程中产生呢?它是在解题的过程当中,你给它问了很难的问题。所以给它提出好问题变得很难。因此现在类似这种DeepSeek的大模型发展,它遇到的一个瓶颈是什么?它需要有人给他提出更难的、有价值的问题。
对于智能辅助驾驶来说,它的体现是什么?你的驾驶行为因为有了强化学习,所以重构了这个场景,你的驾驶行为是可以通过强化学习学出来的。原来大家比较难的点是找不到高质量的驾驶行为,现在这个瓶颈能够被强化学习解掉,但是它缺少什么?它缺少场景,你得告诉它这个是难的场景,那个是难的场景。换言之,怎么开它可以通过强化学习学到,但场景的多样性,这个不能凭空产生,所以在这方面数据还是比较重要的。
Q:之前地平线余凯说99%的人类驾驶数据都不值得学习,你怎么看这个观点?
王晓刚:这是一个很显然的事情。端到端的自动驾驶,它的模式是你输入视频、输出驾驶行为。你开车的时候,90%的情况下你是匀速直线开车,如果你的行驶轨迹一直都是一条直线,那这种监督信号是没有用的。只有当你驾驶状态发生改变的时候,比如要避让、转弯、刹车等情况下,驾驶行为(数据)是有用的。即便是这种有用的信号里面,因为人和人开车不一样,尤其是在比较难的场景,可能10个司机有8个是一些低质量的数据,那就要把这些低质量的数据剔除掉。实际上这件事不是一件新鲜事,因为在类似大模型ChatGPT从互联网上搞的这些数据,90%多的数据也是没有用的,你要不停地去筛选,去掉一些无用的数据,这是同样的道理。
“会基于不同平台、方案、传感器配置,来确定每种技术方案的安全边界”
Q:在成本敏感的低价车型中,商汤绝影如何实现智能辅助驾驶功能的规模化部署?
王晓刚:我们会基于不同的平台、不同的方案、不同的传感器配置,来确定每种技术方案它的安全边界到底在哪里:什么样的事情它是能做的、什么是不能做的。所以这里面对驾驶方案的成熟性,还有仿真测试的要求,也会更高。
Q:目前国内智能辅助驾驶赛道中,既有自研的车企玩家,也有供应商玩家,如何看待这一赛道的竞争?
王晓刚:我们跟东风的自研团队实际上是有一个深度的合作。无论是智能辅助驾驶,还是人工智能,它未来发展的道路还是很长的。将来数据其实是一个非常核心的影响因素。数据在哪里?实际上是在车厂这里。所以说大家一定要做到智能辅助驾驶的自主可控,把握住数据的核心。在智能辅助驾驶的安全性方面,它也有要求。
另外一方面,人工智能的发展又是一个长期、需要持续投入的领域。其目前并未到天花板,而是不断有新的技术、范式出现,这给了我们一个比较好的发展空间。
Q:智能辅助驾驶的终局是什么?
王晓刚:这里应该不光是智能辅助驾驶。我们要把汽车的智能化当做整体来看,因为伴随智能辅助驾驶的发展,其应用的安全性更高,覆盖的场景更多,接着还要跟座舱里面的这种体验相结合,即“舱驾融合”。除了完成基本的通行功能,还要对整个的场景做判断。舱外的智能辅助驾驶数据,跟舱内的体验也会结合在一起,所以未来发展还是有非常大的空间在。
从另一个角度来说,我们认为技术也并不是到了一个时间点就固定下来了。比如去年都在谈论“端到端”是不是一个终极解决方案,但现在来看,“端到端”也有其局限性,所以如今我们讨论的世界模型、模拟仿真、强化学习,这里面的发展空间还是很大。
汽车智能化还处于快速上升、演进、变化的时间点
Q:目前越来越多的车企开始提L3,您觉得L3还有哪些方面需要完善加强的?
王晓刚:本质上我们还要去提升智能辅助驾驶的安全性,这是一个核心的点,原来可能就是在宣传过程中有各种不严谨。此外,我觉得可能对人和车间的关系要求会更高,包括舱驾融合等。
Q:从汽车智能化发展角度来看,现在到瓶颈期了吗?
王晓刚:我觉得还没有。目前汽车行业发展还是非常快的,竞争也非常激烈,大家对新技术、新趋势拥抱程度都非常高。所以,如果是从汽车智能化的角度来看,现在还处在一个快速上升、演进、变化的时间点,远没有达到瓶颈。
Q:汽车行业竞争越激烈,对你们而言是机会还是挑战?
王晓刚:有机会有挑战。竞争激烈的时候,说明这个行业发展非常快,也给了我们更大的发展机会,比如说今年的智能辅助驾驶的爆发。挑战的话,会对你成本控制、自身交付的能力、交付的质量等要求非常高,所以是并存的。