扫码打开虎嗅APP
本文来自微信公众号: 夕小瑶科技说 ,作者:夕小瑶编辑部
上周,谷歌悄悄上线了一套新的Gemini限额机制,引起了众怒。
一大批订阅用户发现和Gemini聊了没几轮,就提示“您已达到当前用量限额,请等待刷新”。Linux和reddit还有知乎上网友的讨论炸了锅。
之前Gemini的限额是按条数算,按天刷新。免费用户一天5条,Pro用户一天100条,不管你怎么问,“今天的天气怎么样”还是“开发一个网页游戏”,都按一条算,反正是你多花钱就多用。
但现在不是了。
改成了算力消耗制。
我是Pro用户,也收到了同样的通知邮件。

从5月20号开始,Gemini改成了基于算力消耗的计费方式。
你发一句“帮我翻译这段话”和你说一句“帮我用Python写一个爬虫”,消耗的额度完全不同。系统会综合计算你的prompt复杂不复杂、对话有多长、用了什么功能,然后扣除对应的额度。文字对话扣得少,写代码、生成视频扣的多。
但是,消耗了多少?不能告诉你。
谷歌官方原话是限制触发速度取决于模型类型及功能负载。也就是我到底用了多少Token?这代码耗了多少算力?用之前都不知道🤷/。Gemini也开始玩另外两家不给明确数字的玩法。
然后是限额的刷新机制也改了。
双重限额上线,5小时滚动窗口限额+周用量limit限额。

第一层是5小时的滚动窗口,用完额度就等5小时后刷新,第二层是是每周总量上限,一旦你这周的总消耗到顶了,只能等下周重置。
这套限额不是只卡免费用户的,还有付费的订阅用户,一大批用户上线第一天就撞上了限额。
知乎上话题《如何评价Gemini于2026年5月17日实行的新限额形式?》一天内暴涨了几十万热度,底下一位网友吐槽说自己是Pro用户,5h limit也就是=3个低质量视频+2个低质量图片+5个简单问题的pro extend,用完之后就降级到低配的Flash-lite模型。

有网友说5小时limit大概是支撑20-30个非复杂问题,如果有图片则会消耗的更快,降到20个问题。
限额这还不是让用户最破防的操作。
打开Gemini官网套餐页,就能看到8美金/月的Plus用户,用量是免费用户2倍,20美金/月的Pro用户是免费用户的4倍用量。

蛤?之前我买个会员,Pro用户是免费版的33倍,Ultra是免费版的166倍,最起码能畅通稳定使用,现在花8美元也就是免费版的2x倍量,付费用户直接变小丑了,还不如注册两个账号。
这波操作上线之后,舆论失控了。

不止是Gemini,谷歌家的AI编程工具Antigravity那边同样被网友骂疯了。新的算力消耗制上线后,Pro用户发现5条对话就能烧掉50%的5小时额度,连续聊上10分钟也会撞上限额。大批用户纷纷吵着要退订。因为同样的话费,服务明显降级变少。

而且因为Flash和Pro模型额度被合并进同一个池子,限额感知更强。

很多人可能不太了解Antigravity,它是谷歌家的AI编程产品,IDE和CLI两种形式都有。一个很大的卖点是你订阅谷歌的Pro或Ultra套餐,不光能用Gemini,还能直接切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型,不用额外付费,不用API,直接能用到claude家的模型,好多人也是冲着20美金用上Claude Opus来的。但是,所有模型共享同一个额度池。
其实,Antigravity的限额收紧比Gemini早得多,从去年12月就开始了,26年3月份已经有用户发现高级模型的刷新周期从5小时悄悄变成了按周,之前还能5小时一刷,现在就得等一周。
紧接着为了平息怒火,谷歌两天内连着加了两轮3倍额度。


网友对Gemini到底降了多少额度做了一个简单总结。总之就是大家的结论一致,还是比以前少。

如果你以为只有谷歌一家在抠,那就大错特错了。
往旁边看一眼,OpenAI和Anthropic也在干类似的事。今年4月,Codex从按消息收费改成了按token计费加积分制,Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用,逻辑和谷歌几乎一模一样。
Claude那边,也把Agent SDK、GitHubActions这些产品从订阅额度里拆出来了,单独走月度积分。
三家几乎一致,都从“交月费随便用”到“交月费只是起步价,用多少算多少”的路走。超过一半以上的头部大模型公司都已经在用按量计费或混合定价了,AI订阅早就变成了云账单的逻辑。
为什么?因为算力是真的不够用。
谷歌自己造TPU,按说应该不缺,也是竞争对手的算力供应商,比如跟Anthropic签了400亿美元的TPU供应合同,但是谷歌自己的DeepMind研究团队还是要排队等算力,导致核心研究员出走。
这波限额叛变的不是谷歌,是整个AI订阅模式的蜜月期,结束了。
[1]Google Antigravity Plans:https://antigravity.google/docs/plans
[2]OpenAI Help,using Codex with your ChatGPT plan:https://help.openai.com/en/articles/20001106
[3]Anthropic,Higher limits for Claude Code with SpaceX Colossus:https://www.anthropic.com/news/higher-limits-spacex
[4]Claude Support,use the Claude Agent SDK with your Claude plan:https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
[6]linux.do,Ultra 3小时后5h额度剩20%:https://linux.do/t/topic/1760337
[7]linux.do,3x补丁被质疑“先缩水再补”:https://linux.do/t/topic/2219076/11
[8]linux.do,周限触发后刷新变4天:https://linux.do/t/topic/1538942/5
[9]linux.do,rate limits/quota/token池换算讨论:https://linux.do/t/topic/2219076