扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
文章批评当前不少科技企业盲目推全员AI,将token消耗变成目标,导致成本爆增却未带来实际价值,提示企业需理性落地AI。 ## 1. 企业全员AI热潮催生token烧钱乱象 当下全球科技圈掀起“全员all in AI”风潮,不少企业定下硬性使用指标,还做内部token使用排行榜比拼用量。已有多家企业出现预算提前耗尽、额度超支问题:有企业单月烧Claude API花费达5亿美元(约34亿人民币),Uber提前烧完2026全年AI coding预算,Meta某员工单月消耗2810亿token,保守估算花费超140万美元。 ## 2. Agent放大token消耗,考核逻辑催生无效浪费 多步自主运行的AI Agent,单任务token消耗量可达普通对话的1000倍,3人小团队靠百余个Agent做开源项目,单月就能烧掉130万美元token成本,远超人力成本。当token消耗量成为考核目标后,符合古德哈特定律:指标不再是好指标,员工为冲榜刷量生成大量无效token,完全没有实际产出。 ## 3. 盲目烧token的投入产出严重失衡 AI原生厂商自产自销,烧token能提升开发效率,Anthropic Claude Code团队100%代码由AI生成,OpenAI周代码合并量提升70%。非原生企业多数投入打水漂:GitClear分析2.2亿行代码发现,AI辅助生成的代码两周内返工量翻9倍、重复代码翻8倍;MIT调研显示,企业投入的300-400亿美元AI资金中,95%没有产生实际价值,多数企业增加了代码交付量,却没产出对用户更有用的功能。 ## 4. AI落地进入理性拐点,成本效率成核心目标 疯狂烧token的风潮已经出现拐点,微软、亚马逊等企业纷纷叫停无限制token授权。行业核心需求已经转变:企业不需要更多token,而是需要能干活、成本可控的AI,目前业内已经出现分层调度模型、控制成本的需求,呼吁避免盲目烧token沦为无效投入。
2026-06-01 22:57

老黄又赢麻了,烧token的公司全成了小丑

本文来自微信公众号: 夕小瑶科技说 ,作者:夕小瑶编辑部


最近,科技圈上演了一场黑色幽默般的反转。


很多人已经感受到,模型厂商把C端用户的订阅,拉成了按token消耗计费的云账单,和企业用法一样。


企业用AI,从第一天起就是云账单逻辑,按照token调用量付费。这本来就是符合常规逻辑。


可是最近,企业的token云账单,爆雷了。


Axios爆出一家公司,一个月在Claude上烧了5亿美元,人民币就是34个亿,仅是一个月的账单。



AI还没替代员工,先把CEO的卡刷爆了。


更黑色幽默的是,老板给全员开了企业授权,然后忘了设上限,token从月初烧到了月底,34个亿就刷地一下烧没了。


其实不怪大家,因为故事的开头,是高管们自己点的火。


过去一年,科技公司的风向是“全员all in AI”。不用AI=落后=要被淘汰。


于是公司们不光鼓励员工用,亚马逊这种甚至给员工定下硬指标,要求80%以上的人每周都得用AI工具,用量还被挂到内部排行榜上比。


这股风刮到什么程度?


Meta内部,一名员工干脆自己做了个面板——“Claudeonomics”,专门统计8万多名员工里谁用AI用得最多,前250名挂榜示众,榜首的称号叫“Token传奇”。


据统计,30天内,全公司员工的token使用量超过60万亿。排名第一的那位老哥,一个人用了2810亿token,扎克伯格都没有排进Top250。。。


哪怕只按Claude Opus每百万token 5美元的输入价保守估算,这位老哥一个月,就烧掉了140多万美元——这还没算贵5倍的输出价。


140万美元,在硅谷够招俩资深工程师。


今年三月,老黄在All-In播客中向硅谷科技公司喊话:


“年薪50万美元的工程师,一年要是没烧掉25万美元的token,我会非常不安。”


果然兑现了,而且是超额完成。


Uber在去年12月给5000名工程师配了Claude code,今年2月只有32%的人在用,3月就冲到84%,七成的代码都靠AI写。


到了四月份,Uber的CTO跳出来说已经把2026一整年的AI Coding预算,烧光了。



烧完,Uber的COO表示:


代码可能确实多交付了一些,但很难把它和“给用户做出了更有用的功能”划等号。“这条线,现在还连不起来。


绷不住的不止这几家。


微软砍掉了内部工程师的Claude Code授权,让他们回去用自家的Copilot。


亚马逊的“Token传奇榜”已经悄悄撤下了,因为他们发现,员工为了冲榜,开始刷token,干了一堆没用的活。


经济学里有条古德哈特定律(Goodhart's Law):


“当一个指标成为目标时,它就不再是一个好的指标。”


如果老板把“烧了多少token”变成考核指标,工程师们就是使劲烧、使劲造。


但是偏偏赶上Agent时代。


现在的AI Agent,干活的方式是这样的:你给它一个任务,它先自己拆解成十几个小步骤,每一步都要调用一次模型;调用完发现不对,再改,再调用。为了“想清楚”,它还会在后台反复推理、自我验证、来回纠错。


你看到的是“它完成了我的任务”。你没看到的是,为了输出这一个结果,它在后台调用了几十上百次模型,每一次都在烧token。


据Axios披露,这种能自己跑多步任务的智能体,消耗的token可能是你和聊天机器人对话的1000倍。


加入OpenAI的龙虾发起人Peter Steinberger晒出了账单:他3个人的小团队,靠一百来个Agent跑开源项目,一个月烧掉了130多万美元的token。



这么一算,企业使用AI的成本,远高于人力成本。


可是这么烧,烧出了什么?


对于有些团队,token还真不是白烧的。


Anthropic Claude Code团队负责人说,自己组里100%的代码都是AI写的。OpenAI也是,每周合并的代码量比以前多了70%。


他们自产自销,烧多少不要紧,因为他们已经推出了用户买单的产品。


但是也有一批公司,感觉在飞,实际可能在原地刨坑。


代码也不是越多越好。


GitClear(一家代码分析公司)发布了一篇报告,分析了2.2亿行代码,发现AI辅助之下,写完两周内就得返工的代码翻了9倍,复制粘贴的重复代码翻了8倍。


MIT也扒了300多个企业AI项目,结论是企业砸进去三四百亿美元,95%是打水漂的。


那家一个月烧34亿的公司,就是其中一个。


所以Uber的COO的话极度清醒,代码可能确实多交付了一些,但很难把它和给用户做出了更有用的功能划等号。


token不是烧的越多越好。


那批疯狂烧token的公司,成了小丑🤡。


老黄虽然在博客中喊出来口号“年薪50万的工程师没烧掉25万token,我会非常不安”,但是同一期博客,主持人问他英伟达自己是不是一年要在token上花20亿美元,老黄说;“我们正在努力。”


token烧得越多,需要的GPU越多,老黄赚的也越多。


整件事,其实是AI行业一个拐点。


为什么微软、Uber、亚马逊都开始shut down了?


当几十亿上百亿的token账单砸过来的时候,老板们可能才回过神来,问题不是用不用AI,而是,不应该把烧了多少token当成信仰和KPI,不应该押注于AI一定能有效干活。


CEO们最想要的,不是更多的token,不是更强的AI,而是能干活的AI,更省的AI。


Salesforce的CEO贝尼奥夫说,公司今年要付给Anthropic大约3亿美元。然后他提了个愿望——希望能有个“智能路由器”,自动判断哪些任务真得用最贵最强的模型,哪些随便派个便宜的小模型就行。


借贝尼奥夫这个愿望提醒大家,别瞎烧token,不要成为挖矿的小丑。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜