Token定名“词元” 它有多重要 AI时代的计量基石
Token定名“词元” 它有多重要 AI时代的计量基石。3月23日,中国发展高层论坛2026年年会上,国家数据局局长刘烈宏宣布AI领域核心术语Token的中文标准译名为“词元”。这一官方定名结束了之前“令牌”“代币”“词块”等译法混用的情况,为中国AI产业构建了统一的技术话语体系,也为智能时代的“算力货币”提供了清晰的定义。

“Token”并不是新词,在编译原理、网络安全、区块链以及大模型时代一直存在,但从未被统一命名。在大模型语境中,Token指的是模型处理文本的最小单位,可以是一个字、一个词,甚至一个子词片段。它是模型处理信息的最小计量单位,无论是用户的提问还是AI生成的一段代码,最终都要被拆解成Token来完成运算。因此,Token调用量成为衡量AI模型活跃度和产业价值的关键指标,调用量越高意味着模型使用越多,创造的实际价值也就越大。

由于不同系统的Token切分方式各异,语义边界不稳定,统一命名的需求日益迫切,“词元”这一标准译名便应运而生。官方定义的词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。作为“词元”的Token不仅是智能时代的价值锚点,也是连接技术供给与商业需求的结算单位,为AI商业模式的落地提供了可量化的支撑。

真正推动“词元”定名的不是语言,而是产业发展。早在2021年前后,“词元”就已被提出,但始终局限于技术圈。两件关键事件推动了它的出圈:一是Token从技术指标变成了计费单位,大模型厂商不再只卖能力,而是卖“用量”,输入多少Token、输出多少Token、每千Token多少钱,这些都像电力和带宽一样被量化、计价、结算;二是规模爆炸迫使统一口径,据国家数据局统计,2024年初中国日均词元调用量仅为1000亿,到2025年底跃升至100万亿,截至今年3月更是突破140万亿,两年间增长超千倍。部分模型企业创下20天收入超越2025年全年总收入的业绩纪录,这背后是一套以Token计费为基础的新型商业逻辑在加速演进。
这次命名过程还反映出一个变化:过去技术术语的命名往往源于学术界或社区共识,而这一次“词元”的定名由官方直接确定。这意味着AI时代的基础概念正从“技术语言”转向“基础设施语言”,当“词元调用量”出现在宏观经济描述中,它便不再只是工程指标,更像是电力消耗、数据吞吐、工业产量,成为衡量“算力经济”的新核心单位。
随着“词元”成为计费与衡量核心,一个新的竞争维度正在浮现:谁能用更少的词元完成同样的任务?这不仅关乎模型能力,也关乎产品设计与工程优化。例如,当贝Molili在词元消耗控制上实现重大突破,其词元消耗相较OpenClaw原版节省一半,有效解决了原版产品“词元消耗过高”的行业痛点。通过动态调整上下文窗口、精简非必要通用信息、优化提示词工程,最终在不影响任务处理质量的前提下实现了词元消耗的大幅降低。
“词元”定名不仅终结了长期以来的译法乱象,更为AI产业发展、商业计费提供了统一参照,彰显了中国AI产业的自主话语权。统一的词元标准让算力成本核算、AI服务定价、产业价值量化有了统一参照,本土产品的技术突破也凸显了我国AI本土化创新的实力,为中小企业和普通用户降低AI使用成本、推动AI普惠化提供了可能。

