ai 为了把具身智能搞起来，智象未来hidream. ai和诺亦腾机器人noitomrobotics 决定联手了

AI为了把具身智能搞起来，智象未来HiDream.ai和诺亦腾机器人NoitomRobotics决定联手了，目标就是把那些大规模、结构化的数据给搞到手。3月30号这俩公司就宣布了这事儿。关键在于把多模态大模型生成的视频能力，跟真正的动作捕捉基础设施合起来，一起把高质量的训练数据弄出来。这一年里估计能攒下几万小时的视频数据，好满足现在产业里对大数据的渴求。现在搞具身智能最大的一个坎儿就是好数据太少。传统做法又贵又慢，根本喂不饱模型。智象未来和诺亦腾的解法就是把真的和生成的合起来用。诺亦腾给高精度的底层数据打下手，用动作捕捉把人在现实世界里的动作抓下来。他们的联合创始人韩磊博士说，光靠一种来源的数据不行，得靠这种混合的方式来提升模型在复杂世界里的泛化能力。智象未来这边负责的是那种能把视频细节控制到毫米级的技术。联合创始人兼CTO姚霆博士强调，普通模型生成的视频容易乱套。所以他们就用自研的多模态大模型，把传感动捕设备抓来的原始数据给放大了一百多倍。这样做不光能让画面更复杂，还能让每帧画面都跟底层操作数据对上号。这意味着生成的视频既真实又多样。往后两家打算在高质量底层数据建设、VLA模型大规模进化和世界模型驱动这一块儿多下功夫。通过把虚拟生成跟物理验证串起来，他们想造一个完整的具身智能数据闭环。这样不光能加快技术研发，也能给相关产业带来新机会。这次把动作捕捉和生成式AI绑一块儿的做法，很可能在某些应用场景里率先取得突破。你觉得这种“真生成”的模式会先在哪一块儿见到成效呢？