扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
硅谷和国内科技公司正将AI token作为新型薪酬组成部分,token分配直接影响工程师生产力与职业前景,算力资源争夺催生新型组织不平等,大厂试图将token塑造成AI时代核心价值单位。 ## 1. Token成为工程师薪酬新标准 - 黄仁勋提出工程师需配备年度token预算,认为token激励可提升10倍效率,阿里等国内企业已开始内部试行。 - 软件工程师年薪37.5万美元(前25%水平)叠加10万美元年化AI成本,总成本20%来自AI使用。 - OpenAI员工透露,面试者开始主动询问岗位token预算,Meta/Google出现算力分配冲突导致离职案例。 ## 2. AI算力演变为生产力分配战争 - 理论测算显示:年耗1.2万美元token可达成每日31项任务处理,10万美元年成本需对应8倍生产力提升。 - 昆仑万维/领英等企业提供每月100-2000美元AI补贴,但资源分配差异导致工程师产出差距快速拉大。 - OpenAI总裁称"推理算力决定软件生产力",组织内部形成"谁有资格多用AI"的新型分层。 ## 3. Token价格暴涨与厂商策略调整 - OpenClaw的token消耗1个月内增长4.4倍至3580亿,AI Agent消耗达普通交互15倍。 - 腾讯GLM5输入输出价格涨450%,智谱两月内两次调价累计涨幅83%,阿里云算力产品最高涨34%。 - 用户实测显示agent成熟后"睡后token"呈指数增长,成为成本控制关键变量。 ## 4. 大厂构建token经济体系的野心 - 英伟达将算力与token绑定为"AI货币",Sam Altman提出"全民基础算力"替代传统收入分配。 - 阿里成立ATH事业群打造token生产-输送-应用闭环,摩根士丹利评估其可能形成独立估值板块。 - 批评者指该模式类似历史上违法的"公司代币",但大厂持续推动token的金融化与制度化。
2026-03-18 15:15

发token 当工资?工程师不只拿现金和期权,开始按token 分身价了

本文来自微信公众号: InfoQ ,作者:褚杏娟,原文标题:《发 token 当工资?工程师不只拿现金和期权,开始按 token 分身价了》


“未来,我们公司的每一位工程师都需要有一份年度token预算。他们年薪大概几十万美元,我可能还会额外给他们配上一笔相当于年薪一半价值的token,因为这能让他们的效率提升10倍。”黄仁勋在GTC上的这番话,点出了硅谷正在出现的一个新现实:token,正在成为吸引人才的新筹码。


“这已经成了硅谷招聘中的一种新工具:这份工作会配多少token?原因很清楚:每一个能拿到token的工程师,生产力都会更高。”他补充道。


类似的趋势,也开始在国内涌现。社交媒体上有消息称,阿里内部已经开始向员工发放token额度,悟空、Qoder可以免费使用,外部AI开发工具的费用也可以报销。


Levels.fyi数据专家Hakeem Shibly还注意到,在一份软件工程师的薪酬申报中,“Copilot订阅”已经被列入员工福利。这看起来只是一个很小的变化,却有很强的象征意义:过去硅谷吸引人才,主要靠工资、奖金和期权;而现在,AI访问权限,正在逐渐成为第四项标准化福利。


要拿token发工资了?


Token之所以变得越来越重要,原因并不复杂。随着生成式AI工具越来越深地嵌入软件开发流程,底层模型的调用成本,正逐渐成为影响生产力的关键变量。


那么,一个重度AI用户到底会花掉多少钱?


根据Theory Ventures的Tomasz Tunguz分享的数据,他个人的AI推理成本,按年化计算,已经冲到了10万美元。


一开始,他的使用量并不高。六个月前,他每个月在Claude上只花200美元;后来又增加了三个agent订阅:Codex、Gemini和Claude Code,月支出上升到600美元。再往后,他开始用AI系统化处理待办事项,每天完成的任务数提升到31个,随之而来的,是每天92美元的推理账单。此后,他在浏览器agent上又额外增加了每月400美元的花费。短短两个季度里,他的推理支出年化水平,就从7200美元涨到4.3万美元,最终突破10万美元。


最后,为了控制成本,Tunguz花了一个周末迁移到开源模型上。经过一轮调优后,新方案的表现已经与原方案几乎没有差别,但成本只剩原来的12%。


按照Levels.fyi的数据,收入位于前25%的软件工程师,年薪大约是37.5万美元。Tunguz估算,如果再叠加每年10万美元的推理成本,那么一个工程师的完全成本就会上升到47.5万美元。换句话说,未来一个工程师超过20%的总成本,可能都来自AI使用本身。


这意味着,对CFO来说,AI开支很快就会变成一项必须被单独追踪的新型人力成本。随着员工对AI的使用越来越深,这笔钱已经不只是“软件订阅费”,而是会直接影响公司的整体现金消耗。


而对公司管理层来说,最核心的问题则变成了:这笔AI支出到底换来了多少回报?如果云基础设施通常用“每小时GPU使用带来的毛利润”来衡量,那么在员工侧,Tunguz认为对应的指标应该是:每一美元推理成本,到底换来了多少有效产出。


Tunguz给出的答案是:一年花1.2万美元,可以换来每天完成31个任务的能力提升。


他最近在LinkedIn上写道:“如果一个工程师一年要烧掉10万美元算力成本,那他最好能把生产力提升到8倍以上。”


模型评估公司Arena的AI能力负责人Peter Gostev甚至提出,OpenAI和Anthropic或许应该建立专门的招聘网站,让客户在发布岗位时,除了标注薪资区间,还能直接写明这个岗位对应的token预算。


“如果这一趋势继续下去,那么2026年很可能会成为一个标志性年份:工程师在谈判薪酬时,不再只谈美元和股权,而是会把token一起谈进去。”Tomasz说,“未来会不会真的出现‘拿token发工资’的情况?到了2026年,你大概率就会开始遇到这种事。”


你有没有资格多用AI?


token之所以越来越重要,还因为它背后所对应的是更底层的资源争夺:算力。


随着生成式AI工具越来越深入软件开发、产品运营乃至组织协作流程,模型运行成本已经不只是一个财务问题,更成为生产力分配问题。


现在,许多公司都在内部强力推动AI使用,甚至以裁员、重组等方式倒逼员工提升AI协作能力。硅谷资深开发者Steve Yegge就认为,如今衡量一家公司的一个关键指标,或许就是token的消耗量。因为这个数字代表着公司的工程师在主动尝试新工作流,非技术岗位也在摸索如何使用AI。只要大家还在尝试,就一定会经历失败,也会在失败中学习。


为了推动内部采用,一些公司已经开始直接给员工发放AI补贴。例如,据InfoQ独家了解到,领英每月提供了2000美元的额度,国内昆仑万维此前也宣布提供每月100美元的支持。


但更早之前,软件工程师和AI研究人员之间,其实就已经围绕GPU资源展开过长期争夺。这类AI算力往往会按照项目优先级被精细化分配。而到了今天,这种争夺正在进一步外显:一些求职者在面试时,已经会主动询问,如果加入公司,自己究竟能分到多少AI算力预算。


此前,Meta就曾被曝出,不同模型团队之间因为算力资源发生过激烈冲突,甚至有员工因此离职。国内阿里千问核心负责人林俊旸的离职也有部分该原因。Google的情况更能说明问题:即便是掌握全球顶级AI基础设施的公司,也因为内部算力紧张,不得不由专门的算力分配委员会来协调。这意味着,算力分配已经不再只是工程调度问题,而是升级为了组织治理问题。


“现在越来越多候选人在面试中会问,如果加入团队,他们能获得多少专属推理算力来使用Codex。”OpenAI Codex AI编程工程负责人Thibault Sottiaux最近就在X上写道。他还补充说,单个用户的使用量增长速度,远快于整体用户数量的增长,这说明AI算力正变得越来越稀缺,也越来越有价值。


这种稀缺性,正在改变工程师对工作和报酬的理解。OpenAI总裁Greg Brockman的说法非常直接:“你能获得多少推理算力,正越来越直接地决定整体的软件生产力。”


换句话说,大厂内部真正稀缺的,已经不只是GPU本身,而是“谁有资格优先使用GPU”。在不远的未来,获得AI资源的重要性,可能会和拿到高薪、厚股权一样重要。对于AI时代的程序员来说,如果拿不到足够多的算力支持,你能够写出来的软件、跑出来的实验、推进的项目,可能都会远远落后于那些拥有更大预算的人,这会直接影响你的职业前景。


而这背后最值得警惕的,是一种新的不平等正在形成。


过去,工程师之间的差距,主要来自经验、执行力、行业知识、架构能力和业务理解。现在,另一种分化正在迅速出现:同样都是高级工程师,同样都懂如何与AI协作,但一个人可以高频调用最强模型,拥有更高的token上限、更低的调用延迟、更少的审批限制;另一个人却只能在有限额度、受限模型和受限工作流里勉强发挥。那么,两个人的实际产出,很可能会在极短时间内被迅速拉开。


这意味着,“会不会用AI”,正在转变为“有没有资格多用AI”。


这已经不再是单纯的技术问题,而是组织资源配置问题。谁的项目更重要,谁更接近核心业务,谁更值得被投资,未来可能不只是体现在团队规模和奖金上,也会体现在推理预算和模型访问权上。


Token价格,已经开始涨了


在“token故事”不断升温的背景下,很多用户最直接的担忧是:未来token会不会越来越贵?


如果以OpenClaw带来的token消耗激增为例,至少从短期看,价格上涨趋势已经很明显。


OpenRouter平台数据显示,OpenClaw的token消耗量从2026年2月3日的806亿,在一个月内飙升到3月4日的3580亿,增长约4.4倍;截至3月2日当周,OpenRouter平台周度token调用量已达到14.8万亿,两个月内增长约160%,而OpenClaw贡献了其中绝大部分增量。根据Anthropic的数据,AI Agent的token消耗量最高可达普通聊天交互的15倍。


Token消耗的快速上升,最直接的后果就是:大模型厂商开始涨价。


腾讯云智能体开发平台自2026年3月13日起调整部分模型计费策略,GLM5、MiniMax2.5、Kimi2.5等模型结束免费公测,转为正式商用并按调用量收费。与此同时,混元系列模型Tencent HY2.0Instruct与Tencent HY2.0Think的价格也进行了调整。其中,Tencent HY2.0Instruct的输入、输出价格涨幅超过450%,Tencent HY2.0Think的输入、输出价格也有所上调,套餐用户则可以通过套餐抵扣部分费用。


智谱在两个月内也已经两次提价。2月12日,智谱推出新一代旗舰模型GLM-5,并在第二天上调GLM Coding Plan套餐价格,涨幅30%起。3月16日,智谱又发布面向OpenClaw的基座模型GLM-5-Turbo,并将API价格进一步上调20%。有媒体统计,相较于GLM-4.7,GLM-5平均涨价约50%;在此基础上,GLM-5-Turbo又比GLM-5提高20%,相对GLM-4.7的平均涨幅已达到83%。



3月18日,阿里云也宣布AI算力、存储等产品最高涨价34%,其中包括:平头哥真武810E等算力卡产品上涨5%-34%,文件存储产品CPFS(智算版)上涨30%。此前1月份,海外云厂商已经有了一轮涨价。


有网友总结自己最近“养小龙虾”的体验时说得很直白:“token消耗量不是线性增长,而是指数型放大。agent一旦成熟,拼的就不再是聊天,而是持续干活。所以,真正可怕的是睡后token。睡后token可能是AI投资里最重要、也最容易被低估的变量。”


长期看,如果token这套故事真的要走向大众化,那么价格最终大概率必须像“水电煤”一样足够便宜。反过来,这也会逼着大厂持续寻找方法压缩模型成本、提升推理效率。但在短期内,价格究竟会上涨还是下跌,关键取决于议价权在谁手里。


大厂正试图把token变成新的价值单位


从更宏观的视角看,token叙事的兴起,也非常符合AI供应链上游大厂的利益。


今年以来,英伟达股价表现持续强于其他超大市值科技公司,仍然是AI浪潮中最大的受益者之一。在黄仁勋的逻辑里,一个新的等式已经成立:在AI世界里,算力就是营收。因为没有算力,就无法生成token;没有token,就无法带来收入增长。因此,算力本身就等于营收能力。


换句话说,算力其实是在替这个世界“印”token,而token正在被塑造成AI时代真正的货币。


Sam Altman这些年反复兜售的,也是一套类似的构想:未来发放的未必是钱,而是tokens。


在2024年5月的All-In播客里,Altman曾提出一个设想:未来更合理的分配方式,也许不是“全民基础收入”,而是“全民基础算力”。在他的描述里,每个人都可以分到一部分GPT-7的算力份额,既可以自己使用,也可以转卖,甚至可以捐出去用于癌症研究。你拥有的不再只是美元,而是生产力本身的一部分。


这显然并不是他一时兴起的想法。在同年5月的Theo Von播客里,Altman进一步描绘了相似的蓝图:如果全世界每年可以生成天文数字级别的token,那么其中一部分进入传统资本分配体系,另一部分则平均分给全球80亿人,让每个人都拥有一笔属于自己的token份额。这几乎就是某种“全球版全民基本财富”的想象。


本质上,他是在尝试把OpenAI所创造的虚拟额度,包装成一种新的财富形式。


也正因如此,外界开始出现不少质疑。有人认为,所谓“用AI token当钱发”的想法,某种程度上反映了一种焦虑:当外部融资环境变化、内部现金消耗居高不下时,企业天然会希望找到一种更轻、更灵活、也更有利于自身的补偿货币。


有网友的评价就很尖锐:“听起来很新潮,但说穿了,这根本不是什么创新。它不过是company scrip的数字化翻版——公司自己发行、只能在自己体系内部流通的‘钱’。这种东西在人类商业史上早就不陌生了,结局也一向不体面:它本质上就是一种剥削工具。在美国,用company scrip给工人发工资,早在1938年就已经被认定为违法。”


而在国内,类似思路也开始被更正式地制度化。阿里已经成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭亲自挂帅,目标是建立一个以“创造Token、输送Token、应用Token”为核心的统一调度中心。摩根士丹利也第一时间发布点评,指出ATH事业群的财务驱动逻辑,与Minimax、智谱等纯模型公司高度相似,未来有可能在现有分部估值框架之外,成为独立的估值组成部分。


阿里背后的判断是:未来大量数字化工作将由数以百亿计的AI Agent支撑,而token正是驱动这些Agent运转的基础燃料,也是人类与数字世界交互的重要载体。


虽然角度略有不同,但国内外大厂如今正在做的事情,都指向了同一个方向:围绕token,改写生产力关系并为其套上金融逻辑。


参考链接:


https://tomtunguz.com/inference-as-compensation/?utm_source=chatgpt.com


https://www.businessinsider.com/ai-compute-compensation-software-engineers-greg-brockman-2026-3?utm_source=chatgpt.com


https://www.youtube.com/watch?v=KLERkM2TJbw

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: