在产业智能化进入深水区的当下,“好数据”正成为决定技术跃迁和产业落地速度的关键变量。
记者从北京经济技术开发区获悉,北京亦庄近期对“数据20条”政策进行首次集中兑现,对20家企业的38个高质量数据集典型案例给予奖励,最高兑现200万元。
相关举措以场景需求为牵引,意在打通数据供给与产业应用之间的堵点,夯实区域智能产业发展的基础底座。
问题在于,当前人工智能应用从通用能力走向行业专用,普遍面临数据供给不足、质量参差不齐、合规流通不畅等现实挑战。
一方面,真实世界场景复杂多变,数据采集成本高、周期长;另一方面,不同行业对可用数据的标准、标注体系和治理要求差异明显,导致“数据能采到、却难以用”“有数据、但难以复用”的现象突出。
尤其在具身智能、自动驾驶、医疗等高门槛领域,数据不仅要“量足”,更要“可验证、可追溯、可持续迭代”,才能支撑模型训练、测试评估和规模化部署。
原因在于,高质量数据集往往具有明显的公共产品属性:投入大、回收慢、外溢效应强。
企业单独建设容易出现“投入难以覆盖收益”的顾虑,进而影响行业整体供给能力。
同时,数据要素市场化配置仍在加速完善中,确权、登记、评估、交易与监管衔接需要更成熟的机制支撑。
政策在此时以资金激励的方式“托底”和“撬动”,有助于把企业对数据建设的积极性转化为可持续的供给能力,并为后续流通利用建立可复制的范式。
影响层面,此次认定的38个数据集覆盖具身智能、生物医药、工业制造、智能网联等重点产业方向,释放出“围绕关键赛道补短板、围绕关键场景建底座”的信号。
在具身智能领域,部分数据集对国内人形机器人真实场景数据供给起到补空白作用,有望提升模型在跨场景泛化与真实任务执行中的稳定性与安全边界;在生物医药领域,围绕病理疑难病例、真实世界证据生成等方向的数据集建设,体现出“专业标注+临床关联+合规脱敏”的路径探索,有助于推动医疗智能化从单点辅助走向系统集成;在工业制造领域,面向柔性制造全流程、钢铁全产业链的数据平台建设,旨在把数据能力嵌入生产与协同环节,提升效率、降低能耗并增强供应链韧性;在智能网联领域,面向复杂交通场景的高质量自动驾驶数据集,为算法迭代、仿真验证与闭环训练提供更贴近国情的样本基础,缓解高级别自动驾驶研发中的数据瓶颈。
对策方面,北京亦庄此轮兑现突出“典型案例认定+政策直达”的导向,既强调奖励激励,也强调以规则推动供给侧质量提升。
多家企业明确表示,资金将用于扩大真实场景数据采集规模、强化合规治理、提升数据开放与接口化能力,并推动与上下游的联合验证和生态共建。
业内人士认为,下一步要让政策激励真正形成产业动能,还需在三方面持续发力:其一,完善高质量数据集评价体系,推动跨企业、跨场景的质量标准、标注规范与测试指标对齐;其二,强化合规与安全底线,推动数据脱敏、授权、审计与可信流通机制更可操作、更可监管;其三,鼓励“数据集成果”向“数据能力供给”升级,通过通用接口、受控开放、联合验证等方式,促进数据在产业链协同中有序流动,提升复用率与转化效率。
前景上看,全球产业竞争正从“算力—算法”加速转向“数据—场景—工程化”综合能力的竞争。
谁能更快形成高质量数据供给体系,谁就更可能在行业模型、智能终端与应用生态上取得先发优势。
北京亦庄以政策兑现推动企业加码研发,叠加区域产业集聚基础,有望在具身智能、医药健康、智能制造、智能网联等方向形成更多可复制、可推广的“数据驱动型产业升级”样板,为建设全域智能产业高地提供更坚实的支撑。
当数据成为新时代的"石油",如何开采、提炼和应用这一战略资源,考验着各方的智慧和决心。
北京亦庄以政策创新点燃数据要素引擎的实践表明,只有将制度优势、产业需求与技术突破有机结合,才能筑牢数字经济发展的根基,在全球化竞争中赢得主动。
这场关于数据要素的价值革命,才刚刚拉开序幕。