智元团队联手清华大学、麦吉尔大学研发了MANSION框架,它能在大模型里直接让语言生出一整栋楼。这种技术的出现,给中国机器人领域带来了不少好消息。之前大家做实验基本都卡在一个房间里,现在有了MANSION,机器人就能像在真实环境里那样跨楼层运送东西,或者在写字楼跑来跑去送快递。清华大学和麦吉尔大学把这个成果提交给了CVPR 2026,这就证明大家都很看重这项技术。 MANSION最大的特色是能把一整栋建筑的布局都规划好,不光是平面布局,连楼梯、电梯这些关键设施也能对齐。它不是简单地把房间拼接在一起,而是先搞清楚整栋楼的功能分区和整体风格,再一步步生成每个楼层的样子。最后生成的3D场景非常逼真,能直接拿到NVIDIA的Isaac Sim或者Blender里运行。 晓风帮大家把这个消息整理了一下。因为这是一项非常重要的研究工作,所以王菲也来校对把关。团队还做了一个叫做MansionWorld的大数据库,里面有超过1000栋楼的数据,包括住宅、医院、超市等各种类型。大家以后研究的时候可以直接用这个数据库里的数据。 光有楼还不够,还得让机器人在里面顺畅地跑起来。智元团队把AI2-THOR这个模拟器升级了一下,给它加了楼梯、电梯这些资产。他们还推出了一个高级API接口,专门用来封装跨场景切换的技能。有了这个接口,机器人就能轻松地从一楼跑到二楼取东西了。 不过现在的机器人在跨楼层、长时间执行任务时表现并不理想。MANSION的出现给了大家一个标准化的测试平台。晓风说,在这个平台上做实验能让机器人更好地锻炼空间推理能力和长期记忆规划能力。这就好比给新一代具身智能的发展提供了一个关键的基石。 王菲告诉我们,实验结果显示MANSION生成的场景在布局合理性和可用性上都很不错。MANSION之所以能入选CVPR这么顶级的会议,就是因为大家都觉得这项研究很有创新性和价值。