北京通用人工智能研究院发布新型运动框架 人形机器人掌握数十种高难度动作

问题——高动态动作长期是人形机器人控制难点。

翻腾、倒立、霹雳舞以及武术踢击等动作,需要瞬时爆发力、全身多关节协同与精细平衡控制,同时还要应对地面摩擦、关节间耦合、冲击载荷等外界不确定因素。

过去相当长时间内,机器人在实验室环境中能“做出来”的动作,往往难以稳定迁移到真实硬件平台,表现为成功率不高、动作可重复性不足、对场地和参数依赖强。

原因——“动作越多,控制越难”是普遍瓶颈。

北京通用人工智能研究院具身机器人中心主任黄思远介绍,随着强化学习在机器人训练中的广泛应用,机器人可在仿真环境中通过大量训练逐步掌握复杂技能,但当动作库不断扩大、希望用一套统一策略覆盖更多技能时,控制精度与稳定性容易下降。

其核心在于:一方面,多任务带来的策略空间急剧膨胀,容易出现“顾此失彼”;另一方面,仿真与真实硬件之间存在差异,尤其是电机驱动、关节摩擦、延迟与饱和等物理特性,会导致在仿真中学到的动作在真实平台“落地”困难。

影响——“通极”尝试在通用性与可部署性之间取得平衡。

此次发布的“通极”人形机器人通用运动框架,面向后空翻、托马斯全旋、武术踢击等数十种高动态动作,强调在真实世界的高成功率部署。

测试数据显示,该框架在多种高动态动作任务上成功率超过90%。

业内人士认为,这一结果意味着在不显著增加工程调参负担的情况下,人形机器人有望更稳定地完成复杂动作组合,为未来在应急救援、特种作业、复杂环境巡检以及互动展示等场景提供更丰富的动作能力储备。

对策——以分阶段学习与“面向硬件”的训练机制提升可执行性。

与传统“从零开始训练统一策略”的路线不同,“通极”采用两阶段学习思路:第一阶段针对不同动作分别训练专门的“专家策略”,确保每个动作在学习过程中都能达到较高上限;第二阶段引入考虑真实电机物理特性的强化学习机制,使策略在训练环节就更贴近硬件约束与动力学特征,从而提升从仿真到真实平台的迁移效果。

该思路在方法上强调“先专后通”,在工程上强调“以硬件为中心”,减少了高动态动作中常见的失稳与偏差累积问题。

前景——面向更复杂技能与更广泛应用仍需系统推进。

受访专家表示,高动态动作的突破并不意味着人形机器人已具备通用作业能力。

下一阶段的发展重点,可能集中在三方面:其一,动作技能从“单次完成”走向“连续组合”,实现更强的任务编排能力与安全约束;其二,从结构化环境走向开放环境,在不同地面材质、空间限制与外部扰动下保持稳定表现;其三,进一步提升能耗效率与硬件寿命,降低高动态动作对机构冲击与维护成本的压力。

随着运动框架与感知、规划、手部操作能力逐步融合,人形机器人有望从“展示型技能”迈向“实用型能力”。

值得关注的是,此次成果由一批年轻研究者完成,主要来自北京通用人工智能研究院通用人工智能协同攻关合作体人才培养计划的联培博士生。

黄思远表示,团队采用“从研到用”的闭环训练方式,让学生在真实机器人平台上围绕问题开展研究并完成验证。

业内认为,在关键技术攻关与人才梯队建设并重的路径下,面向未来的机器人基础能力有望加速迭代。

从精密仪器到动态运动,人形机器人正经历从"机械执行"到"智能体态"的范式转变。

这项立足中国科研土壤的原创成果,既展现了基础研究与应用创新的协同效应,更印证了人才梯队建设对关键技术攻关的战略价值。

当更多青年科学家在自主平台上勇闯"无人区",我国智能机器人产业必将迎来质的飞跃。