智能“词元”:AI Token的官方定名
3月23日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏指出,Token“词元”不仅是智能时代的价值锚点,更是连接技术与商业的“结算单位”,让商业模式落地有了量化可能。
这便确立了Token的官方中文译名:“词元”。
对于经常使用ChatGPT、文心一言、豆包等大模型的朋友来说,Token这个词并不陌生。上下文窗口多少Token、输入输出消耗多少Token、计费按Token算……可它具体指什么?
什么是Token?
Token /ˈtəʊkən/ 本身是多重含义的词汇,但其核心含义非常统一:
代表某种信息、权限或价值的最小单元、标识或信物。
从词源上追溯,它源自古英语,本义就是“符号、标志、象征”,寓意用一个小单元来代表更宏大的意义。
剑桥词典的英文释义:
1. something that you do, or a thing that you give someone, that expresses your feelings or intentions, although it might have little practical effect
标志;表示;象征
2. a piece of paper, a card, or an electronic document with a particular amount of money shown on it that can be exchanged in a shop or online for goods of that value
礼券,代金券
3. a round metal or plastic disc that can be used instead of money
(某些机器中用以代替纸币的)代币,专用辅币
在不同领域中,它扮演着截然不同的角色:
截图:whatisciyuan.com
网络安全:Token = 令牌,用于登录验证的加密凭证串
区块链:Token = 代币/通证,代表数字资产或权益
编译原理:Token = 词法单元,代码被拆分后的最小片段
人工智能大模型:Token = 模型处理语言时的最小文本单元
AI里的Token
在AI领域,Token是模型处理信息的最小计量单位,无论是用户提问还是AI生成的代码,最终都要被拆解成Token才能进行运算。
正因如此,Token调用量成为衡量AI模型活跃度和产业价值的关键指标,调用量越高,代表模型使用越频繁,创造的实际价值越大。
大模型并不直接“认识”完整的句子或词语,而是先将文本切分成一个个小片段,再进行计算。
这些片段,就是Token。
它不一定非要是完整的字或词:
- 可能是一个字
- 可能是一个词
- 可能是半个词(前缀、后缀)
- 也可能是标点、符号
Token的粗略换算公式:
英文:1 Token ≈ 4 个字母 ≈ 0.75 个单词
中文:1 Token ≈ 1.5~2 个汉字
这也是为什么你输入文字时,AI会显示消耗了多少Token——本质上是在统计模型处理了多少个最小单元。
国家数据局数据显示,截至今年3月,中国日均词元(Token)调用量已超140万亿,对比2024年初的1000亿增长了1000多倍,对比2025年底的100万亿,三个月内又增长了40%多。
英文报道
Chinese officially has its own word for “AI token”: 词元 (cíyuán). The China National Committee for Terminology in Science and Technology announced on Wednesday that it is recommending “ciyuan” as a trial translation for the AI term. In Chinese, 词 (cí) means “word,” and 元 (yuán) can mean currency or unit.
中文终于有了 “AI token” 的官方定名:词元(cíyuán)。全国科学技术名词审定委员会于周三宣布,建议将 “词元” 作为这一人工智能术语的试用译名。在汉语中,“词” 意为 “词语”,而 “元” 可表示单位或基本单元。
A token is the smallest unit of data processed by an AI model, enabling AI to understand and process information, while also measuring usage and cost. By March 2026, China’s daily token usage had exceeded 140 trillion, up more than 1,000 times from early 2024, according to official data.
Token 是人工智能模型处理数据的最小单元,它使 AI 能够理解和处理信息,同时也用于统计使用量与计算成本。官方数据显示,截至 2026 年 3 月,中国日均 token 使用量已突破 140 万亿,较 2024 年初增长逾千倍。
Final approval for the term will be determined through the committee’s standard review process for computer science terminology, which takes into account how the term is adopted by the public.
该术语最终能否正式定名,将由委员会按照计算机科学名词审定流程确定,审定过程会兼顾这一名词在公众中的接受与使用情况。
可借鉴词汇 & 表达整理
🔍 officially has its own word for …为…… 正式定名 / 终于有了官方说法
X officially has its own word for Y: Z.
X 为 Y 正式定名:Z。
🔍 trial translation 试用译名
🔍 AI term 人工智能术语
🔍 the smallest unit of data 数据最小单元
🔍 enable … to do …使…… 能够做……
🔍 measure usage and cost 统计使用量与计算成本
🔍 exceed 140 trillion 突破 140 万亿
🔍 up more than 1000 times from …较…… 增长逾千倍
By [time], … had exceeded …, up … times from …
截至某时间,…… 已突破……,较…… 增长…… 倍。
🔍 final approval 最终审定 / 正式批准
🔍 standard review process 标准审定流程
🔍 computer science terminology 计算机科学名词
🔍 take into account 考虑到;兼顾
🔍 be adopted by the public 被公众接受与使用
source: Sixtone、人民日报
- 结束 -
特别推荐
2025年1-12月 | 中国日报双语新闻热词,全年合集(1000+词条翻译,强烈建议收藏!)
往期内容:2025年双语新闻热词合集
1月China Daily双语新闻热词合集PDF
2月|中国日报双语新闻热词合集PDF
3月|中国日报双语新闻热词合集PDF
4月|中国日报双语新闻热词合集
5月|中国日报双语新闻热词合集PDF
6月|中国日报双语新闻热词合集PDF
7月|中国日报双语新闻热词合集PDF
8月|中国日报双语新闻热词合集PDF
9月|中国日报双语新闻热词合集PDF
10月|中国日报双语新闻热词合集PDF
11月|中国日报双语新闻热词合集PDF
12月|中国日报双语新闻热词合集PDF-