北京亦庄重奖高质量数据集 推进数据要素市场化改革

数据作为新型生产要素,高效供给对推动产业创新发展至关重要;近日,北京经济技术开发区对北京人形机器人创新中心“RoboMIND2.0数据集”等38个数据集进行了集中奖励,最高可兑现200万元。这是北京亦庄2025年发布“数据20条”政策后的首次大规模兑现,反映了地方政府对数据产业的持续投入与支持。 从国家层面看,“十五五”规划建议提出要加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等要素的高效供给。这个部署为北京亦庄的数据产业发展明确了着力点。北京经济技术开发区已获批国家数据产业集聚区试点,正打造“亦城数港”产业集聚标杆,通过政策激励与产业生态建设,推动数据要素市场化配置改革深入走深走实。 此次获奖的38个高质量数据集多个关键领域取得进展。在具身智能领域,“RoboMIND2.0数据集”填补了国内双足人形机器人开源数据的空白,支撑国内首个通过国标测试的跨本体具身VLA大模型训练与开源,提升机器人在多类应用场景中的可用性,推动具身智能加速向更高水平发展。北京人形机器人创新中心具身数据负责人纪俊杰表示,现有行业数据仍难以完全满足人形机器人模型训练需求,团队将进一步扩大真实场景数据规模,推动机器人在实际应用中的落地。 在工业制造领域,数据驱动的智能升级效果正在显现。北京蚂蚁工场智造科技有限公司构建了国内首个覆盖“非标+标准件”全流程柔性制造的强合规数据集,补齐了“数据驱动智能制造闭环”与“大模型可持续训练”两上短板。星龙数智首创钢铁行业全产业链高质量数据集建设与应用平台,助力钢铁企业生产协同效率提升超过10%,能源消耗降低3%以上。实践表明,高质量数据集的开发与应用能够直接转化为产业竞争力和经济效益。 北京蚂蚁工场智造科技有限公司副总经理王东泽透露,下一步公司将把“数据集成果”升级为“数据能力供给”,将能力做成通用接口,并探索受控开放、场景共建和联合验证,推动数据产业链协同中更顺畅地流动。这也反映出行业趋势:从“建数据集”走向“供数据能力”,从数据孤立走向链条协同。 北京亦庄的探索是北京推动数据产业高质量发展的一个缩影。2025年6月,北京市发布《关于建设数据要素综合试验区深化数据要素市场化配置改革的实施意见》,明确打通数据供给、流通、应用和安全“四个环节”,构筑数据技术创新、要素服务和产业发展“三大体系”,建设国家数据管理中心、国家数据资源中心和国家数据流通交易中心,打造国家数据科技创新策源地和发展高地。在制度支撑下,北京开展了更系统的探索。截至2025年11月,北京市累计备案大模型达162款,居全国首位;累计建设5G基站近15万个,每万人拥有5G基站数达69个,位居全国首位;建成5G-A基站超1.7万座,实现重点区域全覆盖。这些数据体现了北京在数据基础设施与技术创新上的领先优势。 国家数据局局长刘烈宏在国务院新闻办公室举办的高质量完成“十四五”规划系列主题新闻发布会上介绍,北京、上海、广州、深圳、杭州等城市资源要素富集、技术创新活跃、应用场景丰富,吸引大量头部企业与创新主体,产业生态集聚趋势明显。数据技术正从商业智能加速向人工智能演进,以数据深度挖掘与融合应用、算法算力和数据高度集成为特征的产业生态正在形成。 在生物医药领域,数据驱动创新也在提速。北京麦克奥迪医疗科技有限公司采用“三甲医院病理专家诊断意见+AI制片质控+临床信息关联脱敏数据”模式打造数字病理疑难病例数据集,涉及的数据已获得北京数据交易所《数字资产登记凭证》。该公司资深专家邱文兰表示,公司将利用专项资金持续加大研发投入,推进数据开放上架与AI应用大模型开发。该数据集有望成为北京亦庄医药健康与医疗AI产业的重要基础资源,支撑医疗AI产品落地应用,带动产业集聚发展。 展望未来,北京亦庄将继续推进“数据20条”政策,聚焦数据产业全链条关键环节,持续落地政策兑现举措,2026年总规模将超过2亿元。这表明,北京在数据产业发展上的投入与推进力度仍将进一步增强。

数据要素价值的释放,不仅取决于“有没有数据”,更取决于“数据是否高质量、能否合规流通、能否在场景中产生真实效益”。北京亦庄以政策兑现引导高质量数据供给,叠加制度创新与基础设施优势,为数据要素市场化配置改革提供了可观察的实践样本。面向未来,唯有坚持质量导向、守住安全底线、促进开放协同,才能让数据在更大范围内更有效地转化为新质生产力发展的支撑力量。