扫码打开虎嗅APP
本文来自微信公众号: RUC新闻坊 ,作者:人大新闻系
随着以OpenClaw为代表的AI Agent加速进入日常生活,“Token”也从技术圈的专业术语,变成越来越多人频繁提起的新词。
3月23日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏将Token的中文译法明确为“词元”[1]。至此,这个原本略显陌生的技术概念,拥有了更统一的中文表达,也进一步走入公共讨论。
“词元”支撑了AI时代模型的理解、生成与交互。它隐于模型之后,却参与了每一次提问、每一次回答,也在不断决定AI的成本、效率与能力边界。
那么,Token究竟是什么?它如何能像“货币”一样,成为AI时代衡量资源与价值的基本单位?而当AI开始接管越来越多的社会场域,Token又将如何影响我们未来的工作与生活?
Token,是人工智能时代智能设备中信息存储、处理和交换的具有一定语义的基本符号单元。[2]
如果说工业时代许多资源最终要折算成电力消耗,那么在大模型时代,越来越多的智能活动正在被折算为Token的处理量。在用户向模型输出指令后,模型会将文本拆分成最小处理单元、计算单元直接的关系并输出文本。而这个最小处理单元,正是Token。
在多模态模型中,这一机制被进一步扩展到图像等非文本信息。看似连续的图像会被切分为更小的视觉片段(如图像块或特征区域),并通过编码过程转化为一组可以参与计算的Token序列,从而纳入同一套计算与生成框架之中。

Token一头连着模型能力,另一头连着算力成本,因此也逐渐成为观察AI运行的一把尺子。消耗的Token越多,通常意味着模型需要处理的内容越长、上下文越复杂、推理链条越深,对计算资源的占用也越高。
如今,Token经济已经出现按量收费、包月收费以及按价值收费三种商业模式[3]。许多大模型产品之所以不再只是按次数计价,而是转向按输入和输出的Token数量计价,本质上正是因为Token比提问次数更能说明模型真实的资源消耗。这种变化,也让Token成为了一项可以被持续追踪的产业指标。
过去两年,Token调用量的增长速度极快。公开数据表明,2022年中至2025年中,相关平台的Token处理量在3年间增长了10倍,到2025年中已突破100万亿Token[4]。对应到国内市场,2024年初,我国日均Token调用量约为0.1万亿;至2025年底,跃升至100万亿[5]。Token经济的井喷式发展背后,除了人工智能技术的步步提升之外,不可忽视的是AI与人们越来越不可分割的关系。
当Token进入计费体系后,它就不再只是模型内部的处理单位,也成为整个AI产业通用的价格刻度。但问题也随之出现:同样是Token,为什么价格并不一样?
最明显的一层差异,来自输入与输出的区分。对大多数大模型公司来说,输入Token和输出Token通常分开计价,而且输出往往更贵。在模型读取指令并生成内容的过程中,消耗算力最多的部分,往往是逐词生成答案时持续进行预测与计算的过程。

价格差异也存在于不同模型之间。不同模型的能力、上下文长度和稳定性不同,Token的定价也随之拉开。模型越强、可处理的上下文越长,价格通常越高。很多时候,平台卖的并不只是Token数量本身,而是这个Token背后所调用的模型能力。
此外,由于分词方式与语言结构的差异,相同语义在不同语言中所对应的Token数量可能存在显著差别,这使得不同语言的表达在计算消耗上并不完全等价。
Token在不同模型、不同平台、不同场景中被标出不同的价格,这背后还牵连着一条更长的成本链。从电力、芯片到数据中心,从模型能力到应用需求,几乎每一层因素,都会参与决定一个Token的最终价值。

从这个意义上说,Token不只是大模型计费表上的一个数字,更像是整个AI产业链的晴雨表。
AI产业发展如火如荼,Token也逐渐进入寻常百姓家。
在最开始使用AI时,我们往往会延续和真实人类对话的习惯,随意提问、不断追问、反复修正表达。然而与AI的对话并不能如真人沟通般顺畅自然,生成的回答总会在关键处停下来,免费额度或付费积分可能会在几个回合之下用尽,只能等到多个小时乃至数天后再开启。
于是,用户开始自发地调整与AI的互动方式。要不要先给背景信息?一次性说清楚还是分几步提问?我们在网上学习更高效的Prompt模板,为降低反复调用模型所产生的成本而有意识地减少对话轮数,甚至因是否该向AI道谢而犹豫不决。
在更高频、也更具目的性的使用情境中,持续且规模化的Token消耗已成为常态。无论是学术研究、内容生产、技术开发,还是日常的信息处理与沟通辅助,只要AI被引入其中,Token几乎都会成为一个不可绕开的中介。而当使用场景不断扩展、使用频率持续提升,这一原本隐匿于模型内部的计量方式,也随之成为连接不同领域、不同需求的通用基础。

但这种变化并不完全来自个体的主动选择。随着AI在工作体系中的深入应用,一系列围绕Token展开的规则正在逐渐形成,并开始以制度化的方式影响使用行为。
AI系统的成本不再按照时间或人力计算,而是围绕Token展开,语言本身第一次被纳入成本核算体系。在实践中,提示词长度、上下文规模与模型复杂度都会直接影响Token消耗,从而影响企业支出。正如Deloitte在报告中指出,传统IT成本模型已难以适应当前的商业形式,“企业必须围绕Token消费建立新的预测、监控与优化机制”。[6]
在这一过程中,Token也正在进入企业预算与组织结构。英伟达首席执行官黄仁勋在3月表示,他会在工程师的常规工资之外,额外发放相当于其基本工资一半左右的Token预算[7]。一些技术岗位也已将token使用预算纳入薪酬谈判,成为继工资与股票之外的“新资源配置项”。

但更深层的变化在于,Token正在重新定义知识劳动本身。同一任务在不同模型或推理路径下的Token消耗可能出现数倍乃至数量级差异,这意味着工作效率愈加取决于Token的组织与调度能力。
在这种背景下,企业往往倾向于将“更频繁地使用AI”等同于“更高效地完成任务”,并出于对降本增效的需求,不断鼓励和推行AI工具的使用。某AI独角兽员工小姜提到,公司已在年会上对Cursor账户Token使用量最高的员工进行表彰,许多互联网企业也会开展“Token竞赛”,不仅对使用量更高者给予奖励,使用量较低者甚至可能面临绩效压力。


一名网友发帖提到其所在公司已经开始根据Token消耗量对员工进行排名/
图源:小红书

通过将思考与表达变为资源分配,Token俨然已成为新时代的粮票,而其所带来的社会影响正在沿着更广泛的路径延伸。
作为统一的计量单位,Token看似为AI使用建立了一套标准化尺度,但这种统一在不同语言之间并不完全成立。在现有分词机制下,不同语言在表达相同语义时所需的Token数量可能存在显著差异:低资源语言存在Tokenization premium(Token溢价),即需要数倍Token来表达相同内容,非拉丁语言的Token成本通常是英语的3–5倍。这些Token分词溢价本质上是一种语言特有的“税”,表现为API成本增加、计算成本/电力消耗增加以及有效输入窗口缩小。[8]

当某种语言需要更多Token才能完成同样的表达时,这种差异就会直接体现在成本、响应速度以及上下文承载能力上。
2023年的一项研究发现,实验的平均财务成本、模型效用(性能)以及每种语言所在国家的人类发展指数之间大多存在负相关关系,华盛顿大学的研究者将此称为“双重不平等”:经济欠发达国家的用户由于过度分词而被收取固定的单次分词费用,但从模型中获得的效用往往却更少。[9]由此,Token作为统一单位所带来的标准化并没有完全抹平差异,反而在某些情况下将语言进一步转化为新的使用门槛。
与此同时,这种看似抽象的计量方式,背后仍然连接着具体的物理世界。AI模型的训练和部署主要在数据中心进行,每一次Token的生成与消耗,都依赖于算力、电力与数据中心的支持。
一个典型的人工智能数据中心耗电量相当于10万户家庭的用电量,而目前正在建设的最大型数据中心的耗电量将是其20倍。Token消费越大,意味着需要更多的计算量,其对应的能源消耗与基础设施压力也在同步增长。

随着生成式AI被嵌入日常应用与企业系统,大规模Token生产正在转化为持续的基础设施负载。国际能源署(IEA)在2025年的报告表明,数据中心已消耗全球约1%至1.5%的电力,到2030年这一数字预计将增加一倍以上,而AI工作负载正成为其中增长最快的部分[10]。Token的持续增长,意味着计算需求、能源消耗与碳足迹的潜在上升,这使得AI的发展开始与气候与可持续性议题发生直接关联。
Token让AI变得可计算,也让人类的认知活动第一次被如此精细地量化。许多人在AI浪潮中首次意识到,原来我们的思考、表达和决策都是有成本、可估量、需管理的——当作为大脑总指挥官的前额叶罢工时,其实就是人类自己的Token用光了,“能工智人”(即能工作的智人,是AI时代人们对自身的一种带有调侃的称谓)也需要冷静期。
在可被计算的表达与不可被简化的意义之间,我们也在重新学习如何提问与思考。想再回到那个完全无需计算提问代价的时刻或许很难,而如何在效率与意义之间展开行动,正是这个时代留给我们的新问题。
(文中受访者为化名,感谢受访者对文章的支持!)
#读者福利RUC新闻坊与中国人民大学出版社合作,将为本期读者免费赠阅5本《OpenClaw实战指南:安全养“龙虾”手册》和5本《养只“龙虾”当助理:零基础玩转OpenClaw》。欢迎留言互动,4月21日前,平台随机从留言中选取10位读者获赠上述书籍。

参考文献:
[1]光明网.(2026.3.24).“Token”中文名定了:词元
https://baijiahao.baidu.com/s?id=1860550295970484657&wfr=spider&for=pc
[2]孙美娟.(2026.3.31).人工智能领域“token”正式定名“词元.中国社会科学网
https://www.cssn.cn/skgz/bwyc/202603/t20260331_5978841.shtml
[3]白惠天袁晓辉.(2026.4.9).Token经济学七问——一份关于AI新经济的入门地图.腾讯研究院
https://mp.weixin.qq.com/s/xkoHKGg9EO-C_sUAPMwVjA?opennew=1
[4]清华大学.(2026).2026年Token经济学全景报告
[5]人民网.(2026.3.24).我国日均词元调用量突破140万亿
https://baijiahao.baidu.com/s?id=1860492461947139778&wfr=spider&for=pc
[6]Deloitte Insights(2026.1.19).AI tokens:How to navigate AI’s new spend dynamics
https://www.deloitte.com/us/en/insights/topics/emerging-technologies/ai-tokens-how-to-navigate-spend-dynamics.html?.com=
[7]The Times of India.(2026.3.26).Microsoft EVP Charles Lamanna confirms'AI perk'during hiring that Nvidia CEO proposed giving engineers
https://timesofindia.indiatimes.com/technology/tech-news/microsoft-evp-charles-lamanna-confirms-ai-perk-during-hiring-that-nvidia-ceo-proposed-giving-engineers/articleshow/129814836.cms?.com
[8]Geoffrey Churchill,Steven Skiena.(2026.1.19).Reducing Tokenization Premiums for Low-Resource Lanuguages.Cornell University
https://arxiv.org/abs/2601.13328?.com
[9]Orevaoghene Ahia,Sachin Kumar,Hila Gonen,Jungo Kasai,David Mortensen,Noah Smith,and Yulia Tsvetkov.(2023).Do All Languages Cost the Same?Tokenization in the Era of Commercial Language Models.In Proceedings of the 2023 Conferenceon Empirical Methods in Natural Language Processing,pages 9904–9923,Singapore.Association for Computational Linguistics.
[10]IEA.(2025).Energy demand from AI
https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai?utm_.com