中国在具身智能领域终于挺过来了,彻底告别了从前那种“跌跌撞撞”的机械状态,如今可以从容地迈向

中国在具身智能领域终于挺过来了,彻底告别了从前那种“跌跌撞撞”的机械状态,如今可以从容地迈向“真人级”应用了。3月19日,我去了一趟北京人形机器人创新中心,也就是那个国家地方共建的具身智能机器人创新中心,亲眼见识了他们在实训现场和数据基地的运作情况,还跟业内专家聊了聊,想弄明白我们是怎么把“机械执行”变成“自主思考”的。 最近有段视频特别火,是一个没有脚本也没有特效的人形机器人和真人打网球。那家伙跑得特别灵活,反应也很快,接起球来简直像模像样。这台机器人是北京银河通用研发的,代表着咱们国家在高动态运动控制和实时决策方面已经走到了全世界的前面。北京银河通用的首席战略官赵于莉跟我说,这个团队自己研发了个叫LATENT的智能算法,相当于给机器人装了个“小脑”。这玩意儿不用去搞那种很贵的动捕数据,光看人类随便怎么动就能自己学出来怎么跑、怎么打。 实测下来,这个机器人正手击球成功率超过了90%,连续跟人拉20局都没问题。就算是时速50公里的来球,它也能在0.1秒内锁定目标,稳稳地接住。前几天宇树科技的王兴兴在亚布力论坛上预测过,今年年中中国机器人的百米速度就能赶上博尔特了。就在19日的半马交付仪式上,北京人形机器人创新中心的首席技术官唐剑也说了件事:去年“具身天工Ultra”跑完半马花了2小时40分42秒,虽然已经是全球记录了,但也就是个业余水平;今年的目标是向专业选手看齐,争取把时间压缩到1个小时左右。 唐剑说,在开放环境里让机器人自主奔跑,难度跟完全无人驾驶差不多。目前我们在这方面跟美国差不多在一条起跑线上了,尤其是在硬件本体和运动控制这两个方向上已经领先了一步。从能跑稳定的长距离马拉松,到春晚那种高难度动作、托马斯全旋、单手翻箱子……国产机器人的流畅度和稳定性都达到了世界一流。 不过大家也知道现在有个大难题:泛化能力不行。机器人现在只能在固定的场景里干活儿,碰到不认识的地方就不灵光了。要解决这个问题就得靠数据和算法。 第一个办法是扩大数据规模和多样性,弥补跟语言大模型还差一两个数量级的差距;第二个办法是用好合成数据和真机实采等新技术来提高数据精度;第三个办法就是多搞算法研发。唐剑觉得机器人没必要非得长得跟人一模一样,关键得有本事在陌生的地方把事儿搞定。 19号那天,创新中心给北京大学、北京理工大学还有华中科技大学这些高校送了货,还给蔚来、中船集团这些伙伴也送了15台“具身天工3.0”和“具身天工Ultra”。他们把“慧思开物”这个平台的全栈技术都开放出来支持大家搞研究。 除了硬件外,在数据训练基地那边的情况也很有意思。那里有近5000平方米的场地,复刻了家居、商超、办公等30多个场景。120多台机器人在那同步作业呢。“天工”系列机器人正在那边练习抓牛油果、分拣果蔬甚至给婴儿换尿不湿这些活儿呢。 具身智能机器人数据与训练基地的负责人蒋未来说,“真机实采数据是机器人理解世界的关键”。创新中心牵头制定了国内第一个具身智能数据采集的行业标准,合格率超过了95%;开源的Robomind数据集下载量破了200万次,还对外交付了几万小时的高质量数据呢。“规模和能力在行业里排第一”,他们正朝着百万小时高质量数据的目标前进呢。