刘烈宏:token是大模型处理信息的最小单元啊,它有智能时代那些可计量、可定价、可交易的特性

国新办24日专门开了个会,专门说第九届数字中国建设峰会的事儿。咱国家发改委党组成员、现在的国家数据局局长刘烈宏,当时在台上也说了,到了2025年年底,国内已经攒下了超过10万个高质量的数据集,总容量加起来都快1000万亿PB了,这数量换算一下,大概是咱们中国国家图书馆所有数字资源的310多倍。他还提到了个很猛的数字,到了今年3月份,国内每天大家叫的“Token”数量就已经超过了140万亿。你看这速度多快,跟2024年初的1000亿比起来,硬是涨了一千多倍;跟2025年底的100万亿比,三个月时间又多干了40%。 刘烈宏局长觉得这Token天天这么多量地被人用,充分说明咱们国家的人工智能是真的在猛冲,应用场景也越来越深。以前可能就是能说说话,现在连拿主意干实事的智能体都出来了。现在大家老说的Token出海,就是咱们产业实力变强的证明。从数据这边看,也能说明数据集是真的多了起来,数据这东西的价值也开始往外冒了。数据要素现在是真的把人工智能的创新带动起来了。 Token不光是个数字符号,更是智能时代的一个锚点。它把技术给的东西和商业要的东西连接在了一起,成了个很好用的“结算单位”。这就让新的商业模式落地有了个能被量化的依据。围绕着Token怎么叫、怎么分、怎么算钱,一套新的价值体系正在飞快地长出来,并且变成了人工智能产业能变现的主要路子。 国内这一天天猛增的Token调用量也说明,随着咱们国家数据要素市场化改革往深处走,好的高质量数据的供给体系正在慢慢搭起来。“数据供应—价值释放”这种良性循环已经有点苗头了。毕竟Token是大模型处理信息的最小单元啊,它有智能时代那些可计量、可定价、可交易的特性呢。