数据已成为驱动产业创新的关键生产要素。北京亦庄此次集中兑现数据奖励政策,是国家推进数据要素市场化配置改革的具体落实。"十五五"规划明确提出要加快人工智能等数智技术创新,强化算力、算法、数据等高效供给,为北京亦庄的数据产业发展指明了方向。 高质量数据集供给不足已成为产业发展的瓶颈。北京人形机器人创新中心开发的"RoboMIND2.0数据集"填补了国内双足人形机器人开源数据空白,支撑了国内首个通过国标测试的跨本体具身VLA大模型的训练和开源。该中心负责人坦言,现有行业数据仍不能满足人形机器人模型训练需求。北京蚂蚁工场智造科技有限公司构建了国内首个覆盖"非标+标准件"全流程柔性制造的强合规数据集,填补了"数据驱动智能制造闭环+大模型可持续训练"的空白。这些突破表明,通过政策激励和资金支持,可以有效引导企业加大高质量数据集的开发力度。 高质量数据集的应用已产生显著经济效益。星龙数智的钢铁行业全产业链数据集建设与应用平台,助力钢铁企业生产协同效率提升超10%、能源消耗降低3%以上。北京麦克奥迪医疗科技有限公司打造的数字病理疑难病例数据集,采用"三甲医院病理专家诊断意见+AI制片质控+临床信息关联脱敏数据"模式,已获得北京数据交易所《数字资产登记凭证》,有望成为医疗AI产业的重要基础资源。这些案例充分说明,高质量数据集既是技术创新的基础,也是产业升级的重要驱动力。 北京正在构建系统性的数据产业发展体系。2025年6月,北京市发布《关于建设数据要素综合试验区深化数据要素市场化配置改革的实施意见》,明确打通数据供给、流通、应用和安全"四个环节",构筑数据技术创新、要素服务和产业发展"三大体系"。北京亦庄已获批国家数据产业集聚区试点,正打造"亦城数港"产业集聚标杆。这些举措为高质量数据集的开发、流通和应用创造了良好的制度环境。 北京在数据产业领域已形成明显的先发优势。截至2025年11月,北京市累计备案大模型达162款、居全国首位;累计建设5G基站近15万个,每万人拥有5G基站数达69个,位居全国首位;建成5G-A基站超1.7万座,实现重点区域全覆盖。国家数据局局长刘烈宏指出,北京、上海、广州、深圳、杭州等城市资源要素富集、技术创新活跃、应用场景丰富,产业生态化集聚趋势明显。 企业正在积极探索数据产业的新模式。北京蚂蚁工场智造科技有限公司副总经理王东泽表示,下一步将把"数据集成果"升级成"数据能力供给",把能力做成通用接口,并探索受控开放、场景共建和联合验证,推动数据在产业链协同中真正流动起来。北京麦克奥迪医疗科技有限公司也表示将利用专项资金持续加大研发投入,推进数据开放上架与AI应用大模型的开发。 2026年,北京亦庄将持续推进"数据二十条",聚焦数据产业全链条关键环节,集中落地系列政策兑现举措,总规模超过2亿元。这表明北京在数据产业发展上的投入力度将更加大,政策支持将更加系统化和持续化。
数据要素市场化改革的难点在于既要"流得动",又要"管得住";既要鼓励创新,也要守住安全与合规底线。北京亦庄以高质量数据集奖励为切口,推动数据从"沉睡资源"向"可用要素"转化,发出以制度牵引、资金撬动、场景驱动促进产业升级的清晰信号。面向未来,唯有持续完善规则、扩大高质量供给、提升开放协同能力,才能让数据真正成为高质量发展的长期动能。