蚂蚁灵波科技给全世界都开源了

最近,蚂蚁集团旗下的蚂蚁灵波科技做了件大事,把它自己开发的两项核心技术——LingBot-VLA还有LingBot-Depth——给全世界都开源了。这两个东西对机器人行业特别重要,因为它们能让机器更好地理解物理世界,去干那些复杂的活儿。现在AI跟实体经济深度融合,“具身智能”成了大家抢着搞的领域。 这次放出的LingBot-VLA模型,最牛的地方是能跨不同的机械结构干活。以前一个模型只能管一种机器人,现在不管是星海图、松灵还是乐聚的产品,它都能控制。在上海交大那个GM-100的评测基准上,它在三个真实平台上的表现都挺不错,跨本体的成功率很高。蚂蚁团队还用真实世界的数据研究了缩放定律(Scaling Law),发现数据越多性能越好,一直增长都没见顶。 为了让大家更好用,他们还开了个配套的训练工具链。这个工具链在8张GPU里跑得飞快,每秒能处理261个样本。效率比国际主流框架高1.5到2.8倍,企业用起来省了好多算力和数据成本。 另外一个LingBot-Depth模型,是专门用来搞定三维视觉感知的难题的。它能把原始的深度数据补全、增强,处理好遮挡反光这些问题。跟奥比中光Gemini 330相机配合起来特别棒。在NYUv2、ETH3D这些测试里它都拿了高分。最神奇的是,它不需要复杂的时序建模就能在视频里保持一致的感知效果,对自动驾驶导航特别有用。这个模型已经通过了专业实验室的认证。 这是中国企业在具身智能这块坚持开放创新的一个例子。把模型和工具都拿出来分享,就是为了降低门槛,让更多机器人能用上先进AI。这次开源不光给了个即用的技术方案,还把科学基准给大家了。这对于建一个健康的中国技术生态很有帮助。