大晓机器人王晓刚:机器人泛化能力不足是最大的问题

大晓机器人的王晓刚这次提到,人形机器人现在的一个通病是不够聪明,泛化能力不足是最大的问题。现在的人形机器人普遍表现得很笨拙,只能在特定的环境下做事,一旦换到别的场景就不行了。王晓刚在博鳌亚洲论坛2026年年会现场解释说,这主要是因为两个原因:数据和模型。以前都是人控制真机来采集数据,效率低不说,数据也不真实。这几年累计的10万小时数据,和目标的1千万小时相比简直就是杯水车薪。 王晓刚说,2025年他们把“环境式数据采集”给提出来了,把第一视角的眼镜、穿戴设备和第三视角的传感器都用上,让人在真实环境里工作时自然就把数据记录下来。比如保洁阿姨这类工人工作时,自然就能采集到数据。要是有1000个人带上这种设备,一天就能积累1万小时的数据量。这种方法采到的数据不仅能通用到不同型号的机器人上,还解决了换个机型就得重新采集的麻烦。 至于模型问题,之前的VLA模型跟机器人本体绑定太死了,只知道输出本体的参数。现在的VLA只能完成分拣货物、拿水杯这种简单动作。王晓刚觉得应该用世界模型来取代它。世界模型能让机器人更懂物理规律和人类行为逻辑,通用性更好。 王晓刚还提到了两种模型协同工作的可能性。他说可以在机器人“大脑”上放两块GPU,一块是世界模型,负责规划复杂任务;另一块是VLA,负责执行简单任务。当VLA遇到复杂情况时,世界模型会重新启动来调整策略。比如要把货物从一个地方搬到另一个地方,世界模型先规划好步骤给VLA执行;如果中间发现情况不对,世界模型又会重新规划下一步。 他认为这种组合未来很有潜力。