扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
当前企业Token消耗全面失控,本文分析失控原因,梳理行业动向,给出企业AI成本管控的预判。 ## 1. 企业AI编程普及现状 目前绝大多数企业管理者都已深度投入vibe coding,不少全球顶级互联网巨头除涉密部门外,已放开使用Claude Code这类外部大模型。 Anthropic一季度营收已达上百亿美金,比肩行业巨头,这份亮眼业绩主要来自巨头企业的大规模采购。 ## 2. Token预算失控的核心表现与行业动向 Uber总裁透露,2026年的Token预算仅4个月就已耗尽,此前企业以鼓励消耗Token为先进生产力象征,如今美国多个巨头已开始着手限制第三方Token消耗。 当前国内真正实现Token自由的企业较少,不过此前对AI使用态度最开放激进的企业,已在考虑调整政策管控Token成本。 ## 3. Token预算失控的六大原因 - AI编程技术成熟度大幅提升,对新手更友好,使用场景和参与人数显著扩张。 - OpenClawn崛起带动AI Agent发展,Token消耗呈指数级增长,云算力厂商现有产能已无法满足客户需求。 - 部分企业考核体系畸形,将Token使用量等同于先进程度,员工习惯将所有问题都交给高成本顶级模型处理。 - AI开发试错成本降低,大量此前会被砍掉的伪需求、脑洞需求也直接启动开发,无权限管控的大厂Token消耗极易爆表。 - 不少大厂员工利用公司免费Token完成工作后,用剩余额度接私活做个人项目,进一步增加了额外消耗。 - 多数员工缺乏成本意识,不会像企业管理者那样按任务层级切换不同成本的模型,全程都使用最贵的顶级模型处理所有任务。 ## 4. 行业未来趋势预判 不少企业管理者预判,2025年下半年顶尖编程模型会迎来大幅跃升,国产大模型也会快速跟进,年底国产大模型编程可用性很可能超越当前顶级美国模型,成本仅为对方的1/10。 多数国内前沿企业打算维持当前政策过渡半年,若预判成真会推动团队全面转向国产大模型降本,Token本身也将迎来降本增效阶段。
2026-05-27 09:43

Token预算失控时代已然来临

本文来自微信公众号: caoz的梦呓 ,作者:caoz,题图来自:AI生成


时代变化太快了。


最近我身边认识的老板们,我也不敢说100%,但直觉99%都沉迷于vibe coding,去年我还经常和他们得瑟我用AI做的小游戏,今年我都不敢吹牛了,每个老板在这个领域投入的时间精力和预算都比我多,不管是功成名就的上市公司董事长,还是仍然在一线打拼的创业者,没有例外你敢信!而且各个来劝我,别用cursor了,太落伍了。


然后就有一个更加有意思的事情,就是很多老板都会吐槽一个事情,现在公司token开销太狠了,每月账单开始让人心疼了。不管是上市公司,还是创业公司。


另一个最近从职场从业者那里听到的消息也很有意思,就是很多巨头为了提升开发效率,已经不那么顾及所谓的代码安全了,claude code几乎无差别地在多个全球顶级互联网巨头内部使用,除了极少数特别涉密的部门,基本上没限制了,我们以前以为这些巨头内部会用自己的模型,或者会基于安全考虑不使用外部大模型,其实不是的。


这也是anthropic最近财务数据非常耀眼的原因吧,一个季度营收上百亿美金,已经比肩巨头了。


但巨头们的token开销也是相当惊人的,他们以为减员增效,可以用token获得更高的性价比,最后账算下来,好像,好像情况开始失控了。


正好最近网上看到一些新闻,美国几个巨头也开始意识到这个问题,并开始着手限制第三方token的消耗了。uber总裁也抱怨短短4个月时间,2026年的token预算已经用完了。


这才多久,前两年还是努力敦促程序员拥抱AI,以消耗token为先进生产力的象征,现在,预算全面失控,估计很快,token消耗逐步收紧将成为越来越多企业的选择。


当然,这个世界不是平的,有些地方,有些企业,还在努力鼓励员工拥抱AI呢,这怎么说,没法说。


几个原因


1、AI编程技术的成熟化,很多老板说,去年AI编程其实还是很多问题的,是呀,去年我磕磕绊绊,真的是因为有多年编程底子才能勉强hold住项目,今年不一样了,困在bug里鬼打墙的情况越来越罕见了。今年小白用AI编程更友好了,所以大家也更愿意去尝试了。


2、openclaw的崛起,ai agent对token的消耗是指数级增加,上周一个海外上市的云算力厂商负责人跟我说过,在openclaw之前他们还是要宣传推销自己的算力资源,openclaw之后,基本上是有多少算力就卖掉多少,根本不愁客户,现在是大量询单吃不下来。


3、一些企业畸形的奖励和考核体系,用的越多越证明自己,但其实产出效率未必那么好。特别是员工习惯把各种无聊的问题也都扔给最贵的模型的时候。


4、试错成本变低,伪需求更容易泛滥,以前提出需求需要排期,需要资源对齐,那么产品经理也好,项目负责人也好,需要评估优先级,需要做出取舍,然后很多需求自己就砍掉了,只保留最关键最核心的。现在,反正两天就能搞定,试试看呗。越来越多脑洞想法都可以试试看,token消耗就爆表了,特别是一些大厂,根本不设限制。


5、做私活的也多起来了,大厂token不受限,公司开发任务交给AI一会就搞定了,然后大把时间,用公司配给的AI自己做点东西,这种据说也挺多的,我昨天开直播,评论区很多人说也会这么做。


6、最关键的是,员工没有成本意识。


其实好几个老板跟我吐槽,他们自己用AI都抠抠索索的,最好的模型当然也要用,但是普通的任务国产模型可以解决,而且成本只有1/n,只有困难任务才交给最好的模型对不对。我现在也是,我大部分开发其实是cursor的auto模式,说白了这底层就是kimi对不对。只有特别关键或者遇到卡壳的时候才会换比较贵的顶级模型。老板们很多都是切换混用,什么模型做设计,什么模型写代码,什么模型做简单任务,什么模型跑复杂分析。但他们员工可没这个意识,最贵的模型全搞定不香么,反正买单的是老板,自己何必给老板省钱。


美国巨头已经集体行动了,财务压力让他们开始反思曾经的tokenmaxxing政策并且开始着手改变,你随便搜索一下这样的新闻已经很多。


国内越来越多企业也开始意识到,并且开始重视这个事情,其实国内目前情况看上去没那么严重,说实话,国内真正实现token自由的公司没那么多,很多公司无障碍使用海外大模型这件事上依然困难重重。我身边的老板都是比较前卫的,他们的案例可能并不是那么有代表性,但是,之前在这方面走的最激进,最开放的公司,可能会重新调整政策,比如进行必要的限额,鼓励和引导程序员通过不同模型切换来控制整体成本,并基于实际产出表现给与必要的额外token成本激励。


当然,今天饭桌上还听到老板们的一个推测,他们认为,今年后半年顶尖编程模型还会有一个巨大的跃升,而国产大模型也会随之快速跟进,那么年底,国产大模型的可用性将很可能超越今天最好的美国大模型的编程能力,并且成本是对方的1/10,如果这个推测属实,他们会敦促团队全面拥抱国产大模型。所以这些老板的想法是,先不过度控制,熬过这半年过渡期看看。


前几年讲降本增效是用token换人,这才多久,token本身也需要降本增效了。


如果你所在的企业仍然实行token自由策略,随便你使用最新最好的大模型,珍惜这段时间吧。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
频道: 商业消费

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: