扫码打开虎嗅APP
本文来自微信公众号: InfoQ ,作者:褚杏娟,原文标题:《发 token 当工资?工程师不只拿现金和期权,开始按 token 分身价了》
“未来,我们公司的每一位工程师都需要有一份年度token预算。他们年薪大概几十万美元,我可能还会额外给他们配上一笔相当于年薪一半价值的token,因为这能让他们的效率提升10倍。”黄仁勋在GTC上的这番话,点出了硅谷正在出现的一个新现实:token,正在成为吸引人才的新筹码。
“这已经成了硅谷招聘中的一种新工具:这份工作会配多少token?原因很清楚:每一个能拿到token的工程师,生产力都会更高。”他补充道。
类似的趋势,也开始在国内涌现。社交媒体上有消息称,阿里内部已经开始向员工发放token额度,悟空、Qoder可以免费使用,外部AI开发工具的费用也可以报销。
Levels.fyi数据专家Hakeem Shibly还注意到,在一份软件工程师的薪酬申报中,“Copilot订阅”已经被列入员工福利。这看起来只是一个很小的变化,却有很强的象征意义:过去硅谷吸引人才,主要靠工资、奖金和期权;而现在,AI访问权限,正在逐渐成为第四项标准化福利。
Token之所以变得越来越重要,原因并不复杂。随着生成式AI工具越来越深地嵌入软件开发流程,底层模型的调用成本,正逐渐成为影响生产力的关键变量。
那么,一个重度AI用户到底会花掉多少钱?
根据Theory Ventures的Tomasz Tunguz分享的数据,他个人的AI推理成本,按年化计算,已经冲到了10万美元。
一开始,他的使用量并不高。六个月前,他每个月在Claude上只花200美元;后来又增加了三个agent订阅:Codex、Gemini和Claude Code,月支出上升到600美元。再往后,他开始用AI系统化处理待办事项,每天完成的任务数提升到31个,随之而来的,是每天92美元的推理账单。此后,他在浏览器agent上又额外增加了每月400美元的花费。短短两个季度里,他的推理支出年化水平,就从7200美元涨到4.3万美元,最终突破10万美元。
最后,为了控制成本,Tunguz花了一个周末迁移到开源模型上。经过一轮调优后,新方案的表现已经与原方案几乎没有差别,但成本只剩原来的12%。
按照Levels.fyi的数据,收入位于前25%的软件工程师,年薪大约是37.5万美元。Tunguz估算,如果再叠加每年10万美元的推理成本,那么一个工程师的完全成本就会上升到47.5万美元。换句话说,未来一个工程师超过20%的总成本,可能都来自AI使用本身。
这意味着,对CFO来说,AI开支很快就会变成一项必须被单独追踪的新型人力成本。随着员工对AI的使用越来越深,这笔钱已经不只是“软件订阅费”,而是会直接影响公司的整体现金消耗。
而对公司管理层来说,最核心的问题则变成了:这笔AI支出到底换来了多少回报?如果云基础设施通常用“每小时GPU使用带来的毛利润”来衡量,那么在员工侧,Tunguz认为对应的指标应该是:每一美元推理成本,到底换来了多少有效产出。
Tunguz给出的答案是:一年花1.2万美元,可以换来每天完成31个任务的能力提升。
他最近在LinkedIn上写道:“如果一个工程师一年要烧掉10万美元算力成本,那他最好能把生产力提升到8倍以上。”
模型评估公司Arena的AI能力负责人Peter Gostev甚至提出,OpenAI和Anthropic或许应该建立专门的招聘网站,让客户在发布岗位时,除了标注薪资区间,还能直接写明这个岗位对应的token预算。
“如果这一趋势继续下去,那么2026年很可能会成为一个标志性年份:工程师在谈判薪酬时,不再只谈美元和股权,而是会把token一起谈进去。”Tomasz说,“未来会不会真的出现‘拿token发工资’的情况?到了2026年,你大概率就会开始遇到这种事。”
token之所以越来越重要,还因为它背后所对应的是更底层的资源争夺:算力。
随着生成式AI工具越来越深入软件开发、产品运营乃至组织协作流程,模型运行成本已经不只是一个财务问题,更成为生产力分配问题。
现在,许多公司都在内部强力推动AI使用,甚至以裁员、重组等方式倒逼员工提升AI协作能力。硅谷资深开发者Steve Yegge就认为,如今衡量一家公司的一个关键指标,或许就是token的消耗量。因为这个数字代表着公司的工程师在主动尝试新工作流,非技术岗位也在摸索如何使用AI。只要大家还在尝试,就一定会经历失败,也会在失败中学习。
为了推动内部采用,一些公司已经开始直接给员工发放AI补贴。例如,据InfoQ独家了解到,领英每月提供了2000美元的额度,国内昆仑万维此前也宣布提供每月100美元的支持。
但更早之前,软件工程师和AI研究人员之间,其实就已经围绕GPU资源展开过长期争夺。这类AI算力往往会按照项目优先级被精细化分配。而到了今天,这种争夺正在进一步外显:一些求职者在面试时,已经会主动询问,如果加入公司,自己究竟能分到多少AI算力预算。
此前,Meta就曾被曝出,不同模型团队之间因为算力资源发生过激烈冲突,甚至有员工因此离职。国内阿里千问核心负责人林俊旸的离职也有部分该原因。Google的情况更能说明问题:即便是掌握全球顶级AI基础设施的公司,也因为内部算力紧张,不得不由专门的算力分配委员会来协调。这意味着,算力分配已经不再只是工程调度问题,而是升级为了组织治理问题。
“现在越来越多候选人在面试中会问,如果加入团队,他们能获得多少专属推理算力来使用Codex。”OpenAI Codex AI编程工程负责人Thibault Sottiaux最近就在X上写道。他还补充说,单个用户的使用量增长速度,远快于整体用户数量的增长,这说明AI算力正变得越来越稀缺,也越来越有价值。
这种稀缺性,正在改变工程师对工作和报酬的理解。OpenAI总裁Greg Brockman的说法非常直接:“你能获得多少推理算力,正越来越直接地决定整体的软件生产力。”
换句话说,大厂内部真正稀缺的,已经不只是GPU本身,而是“谁有资格优先使用GPU”。在不远的未来,获得AI资源的重要性,可能会和拿到高薪、厚股权一样重要。对于AI时代的程序员来说,如果拿不到足够多的算力支持,你能够写出来的软件、跑出来的实验、推进的项目,可能都会远远落后于那些拥有更大预算的人,这会直接影响你的职业前景。
而这背后最值得警惕的,是一种新的不平等正在形成。
过去,工程师之间的差距,主要来自经验、执行力、行业知识、架构能力和业务理解。现在,另一种分化正在迅速出现:同样都是高级工程师,同样都懂如何与AI协作,但一个人可以高频调用最强模型,拥有更高的token上限、更低的调用延迟、更少的审批限制;另一个人却只能在有限额度、受限模型和受限工作流里勉强发挥。那么,两个人的实际产出,很可能会在极短时间内被迅速拉开。
这意味着,“会不会用AI”,正在转变为“有没有资格多用AI”。
这已经不再是单纯的技术问题,而是组织资源配置问题。谁的项目更重要,谁更接近核心业务,谁更值得被投资,未来可能不只是体现在团队规模和奖金上,也会体现在推理预算和模型访问权上。
在“token故事”不断升温的背景下,很多用户最直接的担忧是:未来token会不会越来越贵?
如果以OpenClaw带来的token消耗激增为例,至少从短期看,价格上涨趋势已经很明显。
OpenRouter平台数据显示,OpenClaw的token消耗量从2026年2月3日的806亿,在一个月内飙升到3月4日的3580亿,增长约4.4倍;截至3月2日当周,OpenRouter平台周度token调用量已达到14.8万亿,两个月内增长约160%,而OpenClaw贡献了其中绝大部分增量。根据Anthropic的数据,AI Agent的token消耗量最高可达普通聊天交互的15倍。
Token消耗的快速上升,最直接的后果就是:大模型厂商开始涨价。
腾讯云智能体开发平台自2026年3月13日起调整部分模型计费策略,GLM5、MiniMax2.5、Kimi2.5等模型结束免费公测,转为正式商用并按调用量收费。与此同时,混元系列模型Tencent HY2.0Instruct与Tencent HY2.0Think的价格也进行了调整。其中,Tencent HY2.0Instruct的输入、输出价格涨幅超过450%,Tencent HY2.0Think的输入、输出价格也有所上调,套餐用户则可以通过套餐抵扣部分费用。
智谱在两个月内也已经两次提价。2月12日,智谱推出新一代旗舰模型GLM-5,并在第二天上调GLM Coding Plan套餐价格,涨幅30%起。3月16日,智谱又发布面向OpenClaw的基座模型GLM-5-Turbo,并将API价格进一步上调20%。有媒体统计,相较于GLM-4.7,GLM-5平均涨价约50%;在此基础上,GLM-5-Turbo又比GLM-5提高20%,相对GLM-4.7的平均涨幅已达到83%。

3月18日,阿里云也宣布AI算力、存储等产品最高涨价34%,其中包括:平头哥真武810E等算力卡产品上涨5%-34%,文件存储产品CPFS(智算版)上涨30%。此前1月份,海外云厂商已经有了一轮涨价。
有网友总结自己最近“养小龙虾”的体验时说得很直白:“token消耗量不是线性增长,而是指数型放大。agent一旦成熟,拼的就不再是聊天,而是持续干活。所以,真正可怕的是睡后token。睡后token可能是AI投资里最重要、也最容易被低估的变量。”
长期看,如果token这套故事真的要走向大众化,那么价格最终大概率必须像“水电煤”一样足够便宜。反过来,这也会逼着大厂持续寻找方法压缩模型成本、提升推理效率。但在短期内,价格究竟会上涨还是下跌,关键取决于议价权在谁手里。
从更宏观的视角看,token叙事的兴起,也非常符合AI供应链上游大厂的利益。
今年以来,英伟达股价表现持续强于其他超大市值科技公司,仍然是AI浪潮中最大的受益者之一。在黄仁勋的逻辑里,一个新的等式已经成立:在AI世界里,算力就是营收。因为没有算力,就无法生成token;没有token,就无法带来收入增长。因此,算力本身就等于营收能力。
换句话说,算力其实是在替这个世界“印”token,而token正在被塑造成AI时代真正的货币。
Sam Altman这些年反复兜售的,也是一套类似的构想:未来发放的未必是钱,而是tokens。
在2024年5月的All-In播客里,Altman曾提出一个设想:未来更合理的分配方式,也许不是“全民基础收入”,而是“全民基础算力”。在他的描述里,每个人都可以分到一部分GPT-7的算力份额,既可以自己使用,也可以转卖,甚至可以捐出去用于癌症研究。你拥有的不再只是美元,而是生产力本身的一部分。
这显然并不是他一时兴起的想法。在同年5月的Theo Von播客里,Altman进一步描绘了相似的蓝图:如果全世界每年可以生成天文数字级别的token,那么其中一部分进入传统资本分配体系,另一部分则平均分给全球80亿人,让每个人都拥有一笔属于自己的token份额。这几乎就是某种“全球版全民基本财富”的想象。
本质上,他是在尝试把OpenAI所创造的虚拟额度,包装成一种新的财富形式。
也正因如此,外界开始出现不少质疑。有人认为,所谓“用AI token当钱发”的想法,某种程度上反映了一种焦虑:当外部融资环境变化、内部现金消耗居高不下时,企业天然会希望找到一种更轻、更灵活、也更有利于自身的补偿货币。
有网友的评价就很尖锐:“听起来很新潮,但说穿了,这根本不是什么创新。它不过是company scrip的数字化翻版——公司自己发行、只能在自己体系内部流通的‘钱’。这种东西在人类商业史上早就不陌生了,结局也一向不体面:它本质上就是一种剥削工具。在美国,用company scrip给工人发工资,早在1938年就已经被认定为违法。”
而在国内,类似思路也开始被更正式地制度化。阿里已经成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭亲自挂帅,目标是建立一个以“创造Token、输送Token、应用Token”为核心的统一调度中心。摩根士丹利也第一时间发布点评,指出ATH事业群的财务驱动逻辑,与Minimax、智谱等纯模型公司高度相似,未来有可能在现有分部估值框架之外,成为独立的估值组成部分。
阿里背后的判断是:未来大量数字化工作将由数以百亿计的AI Agent支撑,而token正是驱动这些Agent运转的基础燃料,也是人类与数字世界交互的重要载体。
虽然角度略有不同,但国内外大厂如今正在做的事情,都指向了同一个方向:围绕token,改写生产力关系并为其套上金融逻辑。
参考链接:
https://tomtunguz.com/inference-as-compensation/?utm_source=chatgpt.com
https://www.businessinsider.com/ai-compute-compensation-software-engineers-greg-brockman-2026-3?utm_source=chatgpt.com
https://www.youtube.com/watch?v=KLERkM2TJbw