在2026年的中国发展高层论坛上,国家数据局局长刘烈宏明确把Token叫做“词元”,把它给定位成“结算单位”。这一变化背后蕴含的重量不容小觑。这不仅仅是改名,更是计量体系正在建立的重要一步。给“Token”换个名字叫“词元”,把它和“字节”、“流量”、“千瓦时”这些已经深入人心的单位相提并论,普通大众得慢慢去理解它。而在企业看来,“词元”则是在人工智能时代衡量成本的新标尺。刘烈宏在同一场演讲中说,人工智能正在从单纯的“对话”走向“决策执行”,这一过程中智能体正在推动中国大模型应用规模的爆发式增长。当然,“词元”数量多并不意味着模型就更智能。其实,“词元”更像水表和电表,记录的是消耗,并不保证质量。决定结果的关键还是模型能力、数据质量、任务设计和提示组织方式。没有高质量的数据,“词元”的消耗就只是一种空转;没有合适的场景,再便宜的“词元”也难以转化成实际的生产力。然而“词元”虽然是小单位,但它可能正垫高一个时代的门槛。和它一样渐渐被我们熟悉的还有“字节”、“流量”、“千瓦时”,这些都是普通人得慢慢去理解的新概念。而对企业而言,“词元”就是人工智能时代“成本”的度量衡。等更多人明白什么是“词元”,人工智能的落地方式也会被重新认识。以后再听到“这个模型很费词元”,我们就不会觉得陌生了。因为人工智能已经不再仅仅展示聪明,而是像水、电一样被精确计量、持续调度、大规模交易。数据显示在2024年初,中国平均每天调用的“词元”数量是1000亿;到2025年底,这个数字跃升到了100万亿;到了2026年3月,它已经突破了140万亿,两年间增长超过1000倍。自2026年1月底以来,有的模型公司创下了20天收入超过2025年全年总收入的纪录。这两组数据足够说明问题:“词元”已经不仅仅是个技术指标了,它正在成为衡量人工智能商业化速度、应用深度和产业景气度的重要观测值。这次在新华社北京3月27日的报道中提到了这样的事实:从“能力布局”迈向“能力结算”的过程中,从关注模型好不好变成了关注智能服务如何计量、如何定价、如何交易的转变才是真正关键所在。过去企业采购软件主要看许可证、账号数和部署周期;现在越来越多企业关注的是可调用、可核算、可复盘的智能服务量。“词元”正是把这种服务量转化为成本与价值的刻度。需要注意的是,“词元”比“字”更准确,也比“令牌”、“标记”更贴近语言处理场景。它特别强调了“基础单元”的属性,既方便公众理解也方便产业、媒体和政策统一口径。在中文语境下给“Token”定名为“词元”格外有意义,“词元”本质上是大模型处理信息的最小信息单元。人类说完一句话后,模型先要把文本切分成一个个的“词元”,再把它们映射成编号,接着才能进行关联、推断和生成。这也是为什么同样一句话在不同模型里“词元”数量可能不一样的原因——切分规则不同导致成本、速度和可容纳上下文长度的不同。 为什么“词元”调用量能快速攀升到140万亿?答案不是简单的“聊天变多了”,而是应用形态发生了变化。对话消耗“词元”,长流程任务消耗更多的“词元”,调用工具、读取文档、连续规划、多轮反馈这些操作都需要反复处理上下文并生成新输出。表面上看用户只是让模型帮忙做事,但系统内部实际上是一次次高密度的信息拆分、调用和结算。 另一方面快速增长的调用量说明数据供给体系正跟上模型推理与应用消耗的节奏,“数据供给—价值释放”的良性循环已经显现端倪。 但要注意的是“词元”多并不等于智能强。企业往往会误解:是不是消耗的“词元”越多模型就越聪明、答案就越好?事实并非如此。真正决定结果的还是模型能力、数据质量、任务设计和提示组织方式。 没有高质量数据“词元”只是空转;没有合适场景再便宜的“词元”也难以转化出真正的生产力。“词元”像是一块很小的砖却可能正在垫高一个时代的门槛。很多人第一次听到“词元”时会觉得抽象陌生,但从此刻起它正像“字节”、“流量”、“千瓦时”一样成了普通人必须理解的新单位成了企业理解人工智能时代“成本”的新度量衡也意味着人工智能开始被纳入更成熟的经济叙事它不只服务于技术研发还会越来越多地出现在预算表采购单报价单和监管语境里等到更多人读懂“词元”人工智能的落地方式也会被重新理解以后再听到“这个模型很费词元”“上下文又超了”“本月预算不够了”我们不妨少点陌生感这也提醒我们人工智能已经不只是在展示聪明而是像水、电、网络和云资源一样被精确计量持续调度大规模交易真正变化的也从来不只是一个中文名字新华社北京3月27日电