版次:002 作者:2026年03月26日
3月25日上午,国家数据局局长刘烈宏在新闻发布会上透露,截至今年3月,我国日均Token调用量已超过140万亿。在官方表述中,他特意补充了一句——“也就是词元的调用量”。
这被不少业内人士解读为一个标志性时刻:Token这个AI领域最核心的技术术语,终于有了官方认可的中文名字——词元。
什么是词元(Token)?国家数据局是这样表述的:词元(Token)是大模型处理信息的“最小信息单元”,具备可计量、可定价、可交易的核心特征。
对于不常接触AI领域的人来说,这段话还是有些抽象,用通俗的话该怎么讲呢?Gmini AI大模型是这样解释的:“词元”(Token),就是人工智能理解和生成人类语言的“乐高积木”或“原子”。当我们人类读书看报时,我们看到的是一个个字、一个个词。但AI的“大脑”是计算机,它看不懂人类的文字,只能处理数字。因此,我们需要把人类的一句话,切碎成一小块一小块的“基本单元”,然后再喂给AI。这个“基本单元”,就是词元“Token”。
在数字经济和人工智能时代,衡量一个社会智能化程度的标尺,很有可能是“词元调用量”。事实上,目前市面上大模型API的计费方式,已经在按词元计价。
“未来,你很可能会收到一份Token账单。它代表着你本月动用了多少AI大脑来协助工作和生活。”浙江大学人工智能学院柴春雷教授这样描述道。 据潮新闻