上汽大众ceo曹旭东:不打算用vla,而是去选世界模型

中国有个叫AutoMomenta的公司,他们不打算用VLA,而是去选世界模型,这次被上汽大众抢先发布了。这家公司的CEO曹旭东在接受采访时提到,传感器的重要性其实排在后面。他解释说,以前大家都是模仿人类老司机开车,没办法超过人。为了改变这种情况,Momenta转向了强化学习,这种方式让AI司机有可能超越人类。去年他们推出的R6就用了这种技术,能在开放环境里自主探索。这次曹旭东又剧透了下一代飞轮大模型R7,把世界模型引入强化学习,让AI看懂物理世界的规律。这一变化让上汽大众总经理陶海龙很感兴趣,直接给曹旭东打电话说要争取首发这款车型。这车型叫ID.ERA 9X,是上汽大众最新旗舰车型,车长超过5.2米的全尺寸增程SUV。这辆车融合了德系机械素质和中国的AI技术。 曹旭东认为过去的行业技术瓶颈在于模仿学习范式。这种方式是模仿人类老司机轨迹提升模型性能的,不过很难超越人类驾驶水平。为了打破这个瓶颈,Momenta转向了强化学习。他觉得这种方式可以让AI大幅超越人类。去年他们推出的R6能在开放环境中自主探索试错,而不是简单模仿人类轨迹。 关于世界模型,大致分为两类:一种是生成世界模型作为云端训练场训练端侧算法;另一种是表征世界模型负责理解物理世界并进行推理。目前行业在这两条路线之间存在争论。 为什么选择世界模型呢?曹旭东认为物理AI时代已经到来,所以自动驾驶技术必须有对物理世界的认知能力。因此他们把世界模型引入强化学习中,让AI有更完整的信息来做出预测和规划。 为什么不选择VLA呢?曹旭东觉得VLA训练侧重点和自动驾驶需求有偏差。VLA训练起源于LLM,底座模型参数量大但很多参数没用于驾驶任务上。 他认为传感器选型重要性只能排在第三位。前两位是数据、算法架构和体系能力。 总之数据和算法架构是关键,数据是AI迭代的基石。算法架构需要把很多算法整合起来形成合力长期积累能力。研发体系能力也很重要。 传感器选型当然越多越好但随着数据、算法架构提升堆传感器数量边际效应会减弱。 总之这次曹旭东介绍了行业过去技术瓶颈和未来趋势,也展示了新一代飞轮大模型R7以及上汽大众首发ID.ERA 9X产品。