【简工博专栏】“词元”这一译名的出炉是我国在ai 领域重要事件之一

最近,我听说了一个有趣的事情,中国在AI领域的话语权之争又添了一笔。Token,这个模型处理信息的最小计量单位,在中国有了一个新的名字:词元。这个动作背后的意义,比大家想象得还要深远。AI时代,Token已经不仅仅是信息单位和算力单位,更是货币单位,它成了衡量AI模型活跃度和产业价值的核心标尺。根据数据,今年3月,中国日均Token调用量已经超过140万亿,跟2024年初相比增长了上千倍。这个数字让人不禁感叹中国AI产业的迅猛发展。 Token这个词在英文里有不同的解释,比如代币、令牌等,这种歧义给技术讨论、政策制定和公众认知都带来了一些困扰。所以,给它一个统一且精准的中文译名显得尤为重要。人民日报最近发起了一个征集活动,希望给AI起一个更顺口的中文名,也反映了大家对技术命名重要性的认识。 其实,在这个问题上我自己也有一些看法。很多网友认为Token已经顺口了,没必要再造中文译名。但是我觉得,这个过程本身就有意义。技术名称往往和话语权、规则制定权联系在一起。在计算机和互联网早期发展阶段,中国需要对这些外来技术进行本土化转译。现在中国在AI领域已经处于领跑位置,给自己的核心概念赋予一个中国名字已经是必须面对的课题了。 尽管这个过程充满挑战,但我们不能忽视其背后的深层含义。把Token改名为词元这件事本身就显示了中国想要掌握话语权的决心。它不仅仅是为了让概念更易懂、更方便讨论,更是为了在全球范围内建立起自己的技术生态和影响力。 当然,“命名”只是一个开始,离真正掌握解释权、定价权还有很长的路要走。中国AI行业虽然在应用领域领先优势明显,但在核心技术创新方面还有待提高。这就需要我们在基础研究上继续发力,自主创造一些未来发展绕不开的核心概念与工具。 这个过程需要治理框架和国际合作共同支撑。随着中国AI发展范式走出差异化道路,国产应用在海外市场占领更多份额,我国主导的人工智能国际合作广泛开展,各项支撑要素也会越来越完善、多元。等到更多基础理论、关键核心技术在中国实验室诞生时,定义权和影响力自然会逐渐转移过来。 从这个角度看,“Token”变成“词元”,或许代表着中国领跑AI征程上又一个具有标志性意义的新起点。简工博专栏主编解放日报 胡幸阳也是这么认为的。 时间回到2024年这个充满机遇与挑战的一年。“词元”这一译名的出炉是我国在AI领域重要事件之一。“词元”这个名称是否精准、能否被行业接受以及未来生命力如何还需要时间来验证。“命名”本身就有相当深远意义。 今天就聊到这里吧!