(问题)智能经济加速成形的背景下,数据供给能否跟上模型训练与应用落地的节奏、数据能否在合规前提下更顺畅地流通,正成为影响产业竞争力与创新效率的关键。尤其是大模型广泛进入政务、工业、金融、交通等场景后,除算力、算法外,“可用、好用、可信”的数据,正在成为决定应用深度与商业化进度的重要变量。如何把数据资源优势转化为可计量、可定价、可交易的生产要素价值,是当前亟待破解的现实问题。 (原因)国家数据局局长刘烈宏24日在国新办发布会上介绍,今年3月我国日均词元(Token)调用量已超过140万亿。词元是大模型处理信息的最小单元,具备在智能时代可计量的特征。调用量快速攀升,反映出两上变化:一是应用侧需求集中释放,更多行业把智能能力嵌入业务链条,带动推理调用持续增长;二是供给侧基础能力加快补齐,高质量数据集建设推进、数据标注产业发展以及算力网络与工程化能力提升,共同支撑模型从“能用”走向“好用”。今年政府工作报告提出深化拓展“人工智能+”,并强调深化数据资源开发利用、健全数据要素基础制度、建设高质量数据集,为上述变化提供政策牵引。 (影响)词元调用量的大幅增长,既是我国人工智能产业进入快速增长期的直观信号,也折射出数据要素价值释放加速。刘烈宏表示,这表明我国人工智能产业竞争力明显增强,也意味着数据集供给规模在扩大,数据要素与人工智能创新发展正在形成良性互动。记者从发布会获悉,截至2025年底,全国已建成高质量数据集超过10万个,总体量超过890PB,约相当于中国国家图书馆数字资源总量的310倍。规模化的数据供给,为行业模型、垂类应用与智能体等新形态提供“燃料”,也推动围绕调用、分发与结算形成新的产业链条与价值体系,成为智能产业商业化的重要路径之一。 (对策)针对高质量数据集建设中“规模小、分布散”等问题,国家数据局会同26个部门遴选72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,推动形成链主带动、多方参与、联合攻关、共建共享的生态体系,提升数据集建设的组织化水平与协同效率。在数据标注领域,国家数据局布局成都、沈阳、合肥、长沙、海口、保定、大同等7个承担先行先试任务的城市,出台《关于促进数据标注产业高质量发展的实施意见》,遴选47个数据标注优秀案例,并组织多场供需对接活动,推动形成标准更清晰、能力更集聚、供需更匹配的标注服务体系。 在制度建设上,国家数据局成立两年多来,探索形成数据要素市场化配置改革“5+3+1”工作体系:健全数据基础制度、建设和运营数据基础设施、场景培育和数据融合应用、建设全国一体化数据市场、壮大数据产业等“五项重点”,以及核心技术攻关、数据标准化、数字人才培养“三项基础”,并把数据赋能人工智能创新发展作为“一项重点”。围绕“政策如何用好”此关键环节,国家数据局正加大数据产权制度的宣传解读力度,结合具体场景明确数据“持有权、使用权、经营权”的配置方案,以产权边界更清晰来增强各类主体供数、用数、运营的信心与预期。 刘烈宏表示,下一步将加力推进数据要素市场化、价值化,加快建立全国统一的数据产权登记制度,抓紧出台建设全国一体化数据市场的政策文件,同步推进数据基础制度和数据基础设施建设,着力解决数据安全、合规与高效流通之间的平衡问题,为数据要素价值释放提供更有力的保障。同时,将协同各方深入实施新一轮高质量数据集建设行动计划,推进“强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放”六大专项行动,以场景需求为牵引,加快打造技术可行、使用便捷、质量可控的高质量数据集,提升数据供给规模与质量。 (前景)今年是“十五五”开局之年,国家数据局将其定为“数据要素价值释放年”。业内认为,随着全国一体化数据市场涉及的政策加快落地、数据产权登记与标准体系逐步完善、场景牵引机制持续健全,数据资源从“沉睡资产”向“流动要素”的转化有望继续提速。面向下一阶段,数据要素与人工智能将呈现双向驱动:高质量数据集将提升模型能力与可靠性,反过来,更广泛的应用需求也将倒逼数据治理、标注体系与合规流通能力升级,推动形成更具韧性与竞争力的智能产业生态。
数据要素价值释放,关键在于以制度创新打通要素流通空间,以高质量供给提升创新效率,以场景应用检验改革效果。日均Token调用量的跃升,既体现产业活跃度,也对规则供给、数据质量与治理能力提出更高要求。以统一市场建设为牵引、以高质量数据集为支撑、以安全合规为底线,才能把数据资源优势转化为新质生产力优势,为高质量发展提供更强支撑。