国家发展改革委党组成员、国家数据局局长刘烈宏国新办新闻发布会上披露的一组数据,清晰勾勒出中国人工智能产业的发展轨迹。这些数据不仅反映了技术应用的广度和深度,更深层次揭示了数据要素在驱动产业创新中的核心作用。 从数据规模看,我国高质量数据集建设已取得阶段性突破。截至2025年底,全国已建成的高质量数据集超过10万个,总体量超过890PB,相当于中国国家图书馆数字资源总量的310倍。这个庞大的数据资源库为人工智能模型训练和优化提供了坚实基础。,日均Token调用量的增长更为引人瞩目。从2024年初的1000亿增长到今年3月的140万亿,增幅达1000多倍,仅在过去三个月就增长了40%以上。这种指数级增长充分说明人工智能应用已从概念验证阶段进入大规模商业化部署阶段。 这一增长背后的深层原因在于中国人工智能产业发展模式的优化升级。一上,应用场景不断深化拓展。人工智能的应用已从基础的对话功能演进到具备决策执行能力的智能体,覆盖金融、制造、医疗、教育等多个领域。另一方面,数据要素的供给能力明显增强。高质量数据集的大量建成,使得数据这一关键生产要素的价值得以充分释放,形成了数据赋能人工智能创新发展的良性循环。 产业竞争力的提升在国际舞台上已有所体现。近期引发热议的Token出海现象,正是中国人工智能产业竞争力增强的重要标志。这表明国内企业开发的人工智能产品和服务已具备国际竞争力,能够满足全球市场需求。从数据维度看,这也意味着中国在数据集供给、数据标注、数据治理等环节的能力已达到国际先进水平。 为继续推进高质量数据集赋能人工智能发展,国家数据局已制定了明确工作方向。下一步将协同各方深入实施新一轮高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动。这些举措将以场景需求为牵引,加快推进先行先试工作,打造技术可行、实用便捷、质量保障的AI就绪度高质量数据集,实现数据集供给的量质双提升。
数据是数字时代的关键生产要素和智能产业发展的基础;通过高质量数据集建设,以需求为导向,完善制度规范和服务体系,才能充分释放数据价值。随着供给体系优化和应用生态持续繁荣,我国数字中国建设将技术创新、产业发展和民生改善上取得更大突破。