今年政府工作报告给智能经济提了个醒,“打造智能经济新形态”的同时,要把深化数据资源开发利用和健全数据要素基础制度这两件事干好。赛智产业研究院的赵刚院长跟记者说,今年咱要跟有关部门联手,培育出更多高价值的场景,把数据要素的乘数效应给发挥出来。具体怎么做?就是得给10多个手里握着大把公共数据的部门好好鼓鼓掌,让他们大方把数据亮出来。用这些公共数据当领头羊,就能拉动整个数据要素市场更好地给经济社会高质量发展帮把手。 到2025年底,全国建好的高质量数据集已经超过10万个,总大小加起来超过了890PB。到了今年3月,咱们国家每天用的Token量(也就是词元)早就飙到140万亿了,跟2024年初那会儿的1000亿比起来翻了1000多倍;跟2025年底的100万亿相比,这才过去三个月又涨了40%多。刘烈宏说了,“日均Token调用量猛增这么多”,说明中国的人工智能发展路子走得越来越顺了,“应用场景在不断深化”。从数据角度看,这意味着数据集的供应量大增,数据要素的价值正在往外冒,“现在是良性互动的阶段”。 下一步国家数据局还得接着干,“持续推进数据赋能人工智能创新发展”。得协同各方搞个新一轮高质量数据集建设行动计划,像强基扩容、标注攻坚这些专项行动都得跟上。还得拿场景需求当“指挥棒”,加快搞先行先试的试点工作。目标就是要打造出那些技术过关、用着顺手、质量有保障的AI-Ready高质量数据集,“实现供给量和质的双提升”。 在制造业这块儿,“AI作为新一代信息技术”已经深度嵌入了各个环节。到2025年末,咱们重点行业企业关键工序的数控化率已经达到了68.6%。工业和信息化部最近又开始搞工业数据筑基行动了,“开展面向人工智能赋能的高质量行业数据集建设先行先试”。“要通过先行先试突破瓶颈。”王彦青司长说,“还得把政策文件和应用指引给印发出来。” 未来得接着使劲推高质量数据集在行业大模型和智能体里的应用。特别是在制造、自动驾驶这些重点领域,“要推动打造‘数据-模型-应用’的闭环”,或者像“Token-智能体-Skills的闭环”那样,“让数据价值在AI应用中更快释放出来”。