2026年3月17日,理想汽车在NVIDIA GTC 2026大会上拿出了MindVLA-o1,给行业来了个大惊喜。詹锟在台上直言,这款模型不是简单的自动驾驶系统,而是能在物理世界干活的通用智能体。它把看的、说的、做的全都装进了一个大模型里,这就意味着以后不光是开车,很多物理活儿都能由它来干。支撑它的是原生的多模态MoE Transformer,加上3D空间理解、多模态思考这些硬功夫,硬是把一个全面的自动驾驶基础模型给搭起来了。 追溯到2021年,理想汽车就开始自己琢磨辅助驾驶技术了。2024年他们先把端到端加上VLM的双系统给造出来并送到了用户手里,算是给跨场景、跨任务的统一理解能力打了个样。到了2025年,他们又把空间理解、语言理解和行动决策这三样东西整合到了一块,搞出了个VLA司机大模型。这一招很管用,直接让用户的月使用率冲到了80%,这是之前没法比的成绩。 这次的MindVLA-o1就是建立在这些积累上的。为了验证技术到底行不行,他们还拿了春节期间的数据来撑腰。那段时间总共跑了2.5亿公里的路,光是VLA指令的调用次数就突破了130.3万次。这说明大家是真的认可这个技术。 未来的事儿更让人期待。MindVLA-o1不光能坐汽车上用,还能让机器人或者别的物理系统变得更聪明。理想汽车干脆就把汽车说成是最大的机器人,说它的本质就是要把硅基生命体的身体和脑子造出来。这想法看着挺超前的,也给以后的智能交通和生活方式指了条新路。 总之,这次MindVLA-o1的发布算是给自动驾驶开了个新纪元的头。有了这个好基础模型接着往前跑,以后的交通肯定会变得越来越智能、越来越贴心。理想汽车在这条路上一直在探路头阵,肯定会推着整个行业一起进步,让我们以后开车出行都能更安全、更省心。