我国日均“词元”调用量突破140万亿 国家级发布会首次统一关键技术术语中文译名

在人工智能技术快速发展的背景下,“Token”作为数据处理的基本单元,其重要性不断上升;但长期以来,此术语的中文译名并不统一,常见的有“令牌”“标记”“代币”等,多数难以准确呈现其技术含义与使用场景。命名不一致不仅增加沟通成本,也不利于技术标准统一和产业合力推进。国家数据局此次将“Token”定名为“词元”,说明了对该概念核心特征的把握:“词”强调其在自然语言处理中承载语义的作用,“元”突出其作为数字经济基础要素和计量单位的属性。该译名既贴合技术特点,也更便于行业形成共识。

术语统一——看似是“怎么叫”——实质关乎“怎么理解、怎么计量、怎么治理”;当“词元”在国家层面被明确,其意义不仅是概念有了定论,更是为产业协作提供共同语言、为规则建设提供统一尺度。面向未来,只有以标准化、绿色化与规范化打牢基础,才能让规模增长真正转化为可持续的创新能力与高质量发展动能。