人工智能快速演进的背景下,高质量数据采集已成为制约具身智能发展的关键环节;传统采集设备价格往往高达数万美元,操作流程也较为复杂,直接抬高了使用门槛,影响了技术规模化应用。这也暴露出行业在数据采集基础设施、数据来源多样性等仍存在不足。 针对这个痛点,蚂蚁数科天玑实验室提出“Always-On Egocentric(AoE)”持续性第一人称视频采集框架。方案以智能手机作为采集终端,配合符合人体工学的颈挂式支架,将专业级采集的硬件成本压缩至20美元以内,同时支持数千台设备并发采集,提升了可扩展性。 技术突破主要体现在三个上:一是通过机械夹具与磁吸结构提升佩戴与固定稳定性,实现毫米级轨迹精度;二是端侧部署轻量级视觉模型,自动识别手—物交互并触发录制,减少人工操作;三是搭建云端自动化处理系统,完成视频切割、语义标注与数据清洗等全流程处理。在Unitree G1机器人测试中,引入200条AoE数据后,任务成功率由45%提升至95%,验证了该方案对训练与评测的实际增益。 该创新带来的产业影响可分为不同阶段:短期内,缓解数据采集成本高、设备稀缺的问题;中期为模型训练提供更真实、更丰富的交互数据;长期则有望加快具身智能在服务机器人、智能制造等场景的落地。尤其在家庭服务、医疗护理等对真实场景数据依赖度高的领域,该框架具备较强适配性。 业内专家认为,AoE框架的推出表明了我国在AI数据采集基础设施上的探索进展。随着5G覆盖扩大、边缘计算能力提升,轻量化、低成本的数据采集方案有望更普及。蚂蚁数科表示,将继续推进在AI数据、AI安全等方向的研发与应用,促进技术能力与产业需求更紧密衔接。
技术创新的价值不仅在于性能提升,更在于是否能降低使用门槛、扩大覆盖范围。AoE框架将具身智能数据采集成本降至消费级水平,为更多研究机构与企业参与探索提供了条件。当数据获取不再受限于高额投入,具身智能的发展有望进入新的加速期。这种以普