2026-03-18 15:15

发token 当工资？工程师不只拿现金和期权，开始按token 分身价了

本文来自微信公众号： InfoQ ，作者：褚杏娟，原文标题：《发 token 当工资？工程师不只拿现金和期权，开始按 token 分身价了》

“未来，我们公司的每一位工程师都需要有一份年度token预算。他们年薪大概几十万美元，我可能还会额外给他们配上一笔相当于年薪一半价值的token，因为这能让他们的效率提升10倍。”黄仁勋在GTC上的这番话，点出了硅谷正在出现的一个新现实：token，正在成为吸引人才的新筹码。

“这已经成了硅谷招聘中的一种新工具：这份工作会配多少token？原因很清楚：每一个能拿到token的工程师，生产力都会更高。”他补充道。

类似的趋势，也开始在国内涌现。社交媒体上有消息称，阿里内部已经开始向员工发放token额度，悟空、Qoder可以免费使用，外部AI开发工具的费用也可以报销。

Levels.fyi数据专家Hakeem Shibly还注意到，在一份软件工程师的薪酬申报中，“Copilot订阅”已经被列入员工福利。这看起来只是一个很小的变化，却有很强的象征意义：过去硅谷吸引人才，主要靠工资、奖金和期权；而现在，AI访问权限，正在逐渐成为第四项标准化福利。

要拿token发工资了？

Token之所以变得越来越重要，原因并不复杂。随着生成式AI工具越来越深地嵌入软件开发流程，底层模型的调用成本，正逐渐成为影响生产力的关键变量。

那么，一个重度AI用户到底会花掉多少钱？

根据Theory Ventures的Tomasz Tunguz分享的数据，他个人的AI推理成本，按年化计算，已经冲到了10万美元。

一开始，他的使用量并不高。六个月前，他每个月在Claude上只花200美元；后来又增加了三个agent订阅：Codex、Gemini和Claude Code，月支出上升到600美元。再往后，他开始用AI系统化处理待办事项，每天完成的任务数提升到31个，随之而来的，是每天92美元的推理账单。此后，他在浏览器agent上又额外增加了每月400美元的花费。短短两个季度里，他的推理支出年化水平，就从7200美元涨到4.3万美元，最终突破10万美元。

最后，为了控制成本，Tunguz花了一个周末迁移到开源模型上。经过一轮调优后，新方案的表现已经与原方案几乎没有差别，但成本只剩原来的12%。

按照Levels.fyi的数据，收入位于前25%的软件工程师，年薪大约是37.5万美元。Tunguz估算，如果再叠加每年10万美元的推理成本，那么一个工程师的完全成本就会上升到47.5万美元。换句话说，未来一个工程师超过20%的总成本，可能都来自AI使用本身。

这意味着，对CFO来说，AI开支很快就会变成一项必须被单独追踪的新型人力成本。随着员工对AI的使用越来越深，这笔钱已经不只是“软件订阅费”，而是会直接影响公司的整体现金消耗。

而对公司管理层来说，最核心的问题则变成了：这笔AI支出到底换来了多少回报？如果云基础设施通常用“每小时GPU使用带来的毛利润”来衡量，那么在员工侧，Tunguz认为对应的指标应该是：每一美元推理成本，到底换来了多少有效产出。

Tunguz给出的答案是：一年花1.2万美元，可以换来每天完成31个任务的能力提升。

他最近在LinkedIn上写道：“如果一个工程师一年要烧掉10万美元算力成本，那他最好能把生产力提升到8倍以上。”

模型评估公司Arena的AI能力负责人Peter Gostev甚至提出，OpenAI和Anthropic或许应该建立专门的招聘网站，让客户在发布岗位时，除了标注薪资区间，还能直接写明这个岗位对应的token预算。

“如果这一趋势继续下去，那么2026年很可能会成为一个标志性年份：工程师在谈判薪酬时，不再只谈美元和股权，而是会把token一起谈进去。”Tomasz说，“未来会不会真的出现‘拿token发工资’的情况？到了2026年，你大概率就会开始遇到这种事。”

你有没有资格多用AI？

token之所以越来越重要，还因为它背后所对应的是更底层的资源争夺：算力。

随着生成式AI工具越来越深入软件开发、产品运营乃至组织协作流程，模型运行成本已经不只是一个财务问题，更成为生产力分配问题。

现在，许多公司都在内部强力推动AI使用，甚至以裁员、重组等方式倒逼员工提升AI协作能力。硅谷资深开发者Steve Yegge就认为，如今衡量一家公司的一个关键指标，或许就是token的消耗量。因为这个数字代表着公司的工程师在主动尝试新工作流，非技术岗位也在摸索如何使用AI。只要大家还在尝试，就一定会经历失败，也会在失败中学习。

为了推动内部采用，一些公司已经开始直接给员工发放AI补贴。例如，据InfoQ独家了解到，领英每月提供了2000美元的额度，国内昆仑万维此前也宣布提供每月100美元的支持。

但更早之前，软件工程师和AI研究人员之间，其实就已经围绕GPU资源展开过长期争夺。这类AI算力往往会按照项目优先级被精细化分配。而到了今天，这种争夺正在进一步外显：一些求职者在面试时，已经会主动询问，如果加入公司，自己究竟能分到多少AI算力预算。

此前，Meta就曾被曝出，不同模型团队之间因为算力资源发生过激烈冲突，甚至有员工因此离职。国内阿里千问核心负责人林俊旸的离职也有部分该原因。Google的情况更能说明问题：即便是掌握全球顶级AI基础设施的公司，也因为内部算力紧张，不得不由专门的算力分配委员会来协调。这意味着，算力分配已经不再只是工程调度问题，而是升级为了组织治理问题。

“现在越来越多候选人在面试中会问，如果加入团队，他们能获得多少专属推理算力来使用Codex。”OpenAI Codex AI编程工程负责人Thibault Sottiaux最近就在X上写道。他还补充说，单个用户的使用量增长速度，远快于整体用户数量的增长，这说明AI算力正变得越来越稀缺，也越来越有价值。

这种稀缺性，正在改变工程师对工作和报酬的理解。OpenAI总裁Greg Brockman的说法非常直接：“你能获得多少推理算力，正越来越直接地决定整体的软件生产力。”

换句话说，大厂内部真正稀缺的，已经不只是GPU本身，而是“谁有资格优先使用GPU”。在不远的未来，获得AI资源的重要性，可能会和拿到高薪、厚股权一样重要。对于AI时代的程序员来说，如果拿不到足够多的算力支持，你能够写出来的软件、跑出来的实验、推进的项目，可能都会远远落后于那些拥有更大预算的人，这会直接影响你的职业前景。

而这背后最值得警惕的，是一种新的不平等正在形成。

过去，工程师之间的差距，主要来自经验、执行力、行业知识、架构能力和业务理解。现在，另一种分化正在迅速出现：同样都是高级工程师，同样都懂如何与AI协作，但一个人可以高频调用最强模型，拥有更高的token上限、更低的调用延迟、更少的审批限制；另一个人却只能在有限额度、受限模型和受限工作流里勉强发挥。那么，两个人的实际产出，很可能会在极短时间内被迅速拉开。

这意味着，“会不会用AI”，正在转变为“有没有资格多用AI”。

这已经不再是单纯的技术问题，而是组织资源配置问题。谁的项目更重要，谁更接近核心业务，谁更值得被投资，未来可能不只是体现在团队规模和奖金上，也会体现在推理预算和模型访问权上。

Token价格，已经开始涨了

在“token故事”不断升温的背景下，很多用户最直接的担忧是：未来token会不会越来越贵？

如果以OpenClaw带来的token消耗激增为例，至少从短期看，价格上涨趋势已经很明显。

OpenRouter平台数据显示，OpenClaw的token消耗量从2026年2月3日的806亿，在一个月内飙升到3月4日的3580亿，增长约4.4倍；截至3月2日当周，OpenRouter平台周度token调用量已达到14.8万亿，两个月内增长约160%，而OpenClaw贡献了其中绝大部分增量。根据Anthropic的数据，AI Agent的token消耗量最高可达普通聊天交互的15倍。

Token消耗的快速上升，最直接的后果就是：大模型厂商开始涨价。

腾讯云智能体开发平台自2026年3月13日起调整部分模型计费策略，GLM5、MiniMax2.5、Kimi2.5等模型结束免费公测，转为正式商用并按调用量收费。与此同时，混元系列模型Tencent HY2.0Instruct与Tencent HY2.0Think的价格也进行了调整。其中，Tencent HY2.0Instruct的输入、输出价格涨幅超过450%，Tencent HY2.0Think的输入、输出价格也有所上调，套餐用户则可以通过套餐抵扣部分费用。

智谱在两个月内也已经两次提价。2月12日，智谱推出新一代旗舰模型GLM-5，并在第二天上调GLM Coding Plan套餐价格，涨幅30%起。3月16日，智谱又发布面向OpenClaw的基座模型GLM-5-Turbo，并将API价格进一步上调20%。有媒体统计，相较于GLM-4.7，GLM-5平均涨价约50%；在此基础上，GLM-5-Turbo又比GLM-5提高20%，相对GLM-4.7的平均涨幅已达到83%。

3月18日，阿里云也宣布AI算力、存储等产品最高涨价34％，其中包括：平头哥真武810E等算力卡产品上涨5%-34%，文件存储产品CPFS（智算版）上涨30%。此前1月份，海外云厂商已经有了一轮涨价。

有网友总结自己最近“养小龙虾”的体验时说得很直白：“token消耗量不是线性增长，而是指数型放大。agent一旦成熟，拼的就不再是聊天，而是持续干活。所以，真正可怕的是睡后token。睡后token可能是AI投资里最重要、也最容易被低估的变量。”

长期看，如果token这套故事真的要走向大众化，那么价格最终大概率必须像“水电煤”一样足够便宜。反过来，这也会逼着大厂持续寻找方法压缩模型成本、提升推理效率。但在短期内，价格究竟会上涨还是下跌，关键取决于议价权在谁手里。

大厂正试图把token变成新的价值单位

从更宏观的视角看，token叙事的兴起，也非常符合AI供应链上游大厂的利益。

今年以来，英伟达股价表现持续强于其他超大市值科技公司，仍然是AI浪潮中最大的受益者之一。在黄仁勋的逻辑里，一个新的等式已经成立：在AI世界里，算力就是营收。因为没有算力，就无法生成token；没有token，就无法带来收入增长。因此，算力本身就等于营收能力。

换句话说，算力其实是在替这个世界“印”token，而token正在被塑造成AI时代真正的货币。

Sam Altman这些年反复兜售的，也是一套类似的构想：未来发放的未必是钱，而是tokens。

在2024年5月的All-In播客里，Altman曾提出一个设想：未来更合理的分配方式，也许不是“全民基础收入”，而是“全民基础算力”。在他的描述里，每个人都可以分到一部分GPT-7的算力份额，既可以自己使用，也可以转卖，甚至可以捐出去用于癌症研究。你拥有的不再只是美元，而是生产力本身的一部分。

这显然并不是他一时兴起的想法。在同年5月的Theo Von播客里，Altman进一步描绘了相似的蓝图：如果全世界每年可以生成天文数字级别的token，那么其中一部分进入传统资本分配体系，另一部分则平均分给全球80亿人，让每个人都拥有一笔属于自己的token份额。这几乎就是某种“全球版全民基本财富”的想象。

本质上，他是在尝试把OpenAI所创造的虚拟额度，包装成一种新的财富形式。

也正因如此，外界开始出现不少质疑。有人认为，所谓“用AI token当钱发”的想法，某种程度上反映了一种焦虑：当外部融资环境变化、内部现金消耗居高不下时，企业天然会希望找到一种更轻、更灵活、也更有利于自身的补偿货币。

有网友的评价就很尖锐：“听起来很新潮，但说穿了，这根本不是什么创新。它不过是company scrip的数字化翻版——公司自己发行、只能在自己体系内部流通的‘钱’。这种东西在人类商业史上早就不陌生了，结局也一向不体面：它本质上就是一种剥削工具。在美国，用company scrip给工人发工资，早在1938年就已经被认定为违法。”

而在国内，类似思路也开始被更正式地制度化。阿里已经成立Alibaba Token Hub（ATH）事业群，由CEO吴泳铭亲自挂帅，目标是建立一个以“创造Token、输送Token、应用Token”为核心的统一调度中心。摩根士丹利也第一时间发布点评，指出ATH事业群的财务驱动逻辑，与Minimax、智谱等纯模型公司高度相似，未来有可能在现有分部估值框架之外，成为独立的估值组成部分。

阿里背后的判断是：未来大量数字化工作将由数以百亿计的AI Agent支撑，而token正是驱动这些Agent运转的基础燃料，也是人类与数字世界交互的重要载体。

虽然角度略有不同，但国内外大厂如今正在做的事情，都指向了同一个方向：围绕token，改写生产力关系并为其套上金融逻辑。

参考链接：

https://tomtunguz.com/inference-as-compensation/?utm_source=chatgpt.com

https://www.businessinsider.com/ai-compute-compensation-software-engineers-greg-brockman-2026-3?utm_source=chatgpt.com

https://www.youtube.com/watch?v=KLERkM2TJbw

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技