GLM-5涨价背后的真相：算力稀缺才刚刚开始-虎嗅网

本文来自微信公众号： AGENT橘，作者：AGENT橘，原文标题：《GLM-5 涨价背后的真相：算力稀缺才刚刚开始》

昨天上午，智谱GLM-5的Coding Plan涨价30%。

这个事情引起了很大的讨论，我也非常理解，毕竟价格是最敏感的话题。

当时我的第一反应是：终于还是涨了。

虽然很反共识，但我一直预期Token会涨价，这个信号是对我预期的一个确认。

模型越强，Token越稀缺，价格越贵。

智谱在商业化上确实显得不够成熟，他们最大的失误就是低估了模型能力进步带来的指数级增长，一开始给的plan太大方，现在模型更大了，算力不够，要么砍用量，要么涨价，没有商业模式支撑的服务无法健康长久。

昨晚一个朋友因为没买到Coding Plan，来借我的API key。

这时候我才意识到，这次涨价之后，依然是限购状态。

涨价+限购，一代人有一代人的茅台？

涨价背后的真相

要理解这次涨价，只需要看清一个结构性矛盾：供给是线性的，需求是指数的。

先看供给侧。

Google 2026年的资本开支相比2025年，差不多翻倍。

这已经是全球最有钱的科技公司之一，倾尽全力在砸算力基础设施了。

你不可能让台积电明天就多造出十倍的芯片。

供给侧的增长曲线，是一条缓慢爬升的直线。

再看需求侧。

需求不是一重指数，是三重指数叠加。

第一重指数：Coding模型能力提升解锁新场景。特别是从Vibe Coding到严肃的Agentic Engineering这一跃升。每一次能力提升，都打开一片10倍的Token消耗场景。

第二重指数：Agent数量本身在爆发式增长。在未来一个人背后可能有10个、100个Agent在7×24小时不间断地调用模型。人会睡觉，Agent不会。人一天工作8小时，Agent一天工作24小时。Agent的数量乘以Agent的工作时长，这个数字的增长速度远超任何人类用户的增长。

第三重指数：Seedance 2.0，Nano Banana Pro这样的多模态模型的Token消耗量远超纯文本。视频生成、图像理解、代码工程，每一个场景的单次消耗都是纯文本对话的几十倍甚至上百倍。当这些场景被模型能力解锁之后，Token的消耗量会出现断崖式的跃升。

三重指数叠加在一起，面对的是一条线性增长的供给曲线。

供给翻2倍，需求翻10倍甚至100倍。

这种结构性的失衡，在可预见的未来一年内，只会增强不会逆转。

所以涨价不是智谱的选择，是物理定律的选择。

有人天真地说，不用担心，大厂会打价格战的。

你见过卖金铺打价格战吗？

稀缺的东西，不存在价格战。

GLM-5凭什么值这个价

涨价30%需要底气，这种底气凭什么？

看三件事就够了。

第一，Coding能力逼近Claude Opus 4.5。

GLM-5几个Coding能力的跑分上，已经追上了Sonnet 4.5，开始朝着Opus 4.5逼近。在多个权威指标上都是开源模型的SOTA。跟自己比，从GLM-4.7到GLM-5，内部评估的编程任务平均增幅超过20%。

除了指标的提升外，GLM-5不只是"写代码更好了"，而是从写代码进化到了写工程。它能自主完成后端重构、深度调试、长程规划与执行，已经在朝着资深架构师的方向迈进。

第二，Agent能力是真正的长程任务执行。

在BrowseComp、MCP-Atlas、τ²-Bench三个Agent评测基准上，GLM-5均为开源第一。在Vending Bench 2的模拟经营测试中，GLM-5经营一年期的自动售货机业务，最终账户余额达到4432美元，接近Opus 4.5。

有些榜是可以刷的，但模拟经营榜，代表模型真的能"做事"。长程任务中的目标一致性、资源管理、多步骤依赖处理，是Agentic Engineering时代的核心能力。

第三，模型参数翻倍，推理成本也提高了。

GLM-5的参数规模从355B（激活32B）扩展到744B（激活40B），预训练数据从23T提升到28.5T，以MIT License完全开源。在顶级模型中，这种开放程度极为罕见。同时值得注意的是，GLM-5已经完成了与华为昇腾、寒武纪、摩尔线程等国产算力平台的深度适配。在全球算力稀缺的大背景下，这件事的战略意义非同小可。

总之，用户付的钱多了30%，但拿到的能力涨了远不止30%。

人是为更好的结果买单，所以涨价完全没毛病。

实测体感

GLM-5是第一个国内敢去对标Claude Opus的模型

我个人测试，目前的水平肯定是达不到Opus 4.6水平的

但我发现GLM-5的思维方式和Opus 4.6非常像，思考深度非常深，有时候我看着这两个模型的思考国产，都会非常惊叹太聪明太全面了。

但遗憾的是GLM-5还不具备Opus 4.6的独立思考能力，会和ChatGPT一样顺着我的意思说。

这是我用GLM-5写的一个体感小游戏，叫《抓马》

能写出直接可玩的游戏，还是非常强悍的。

我和老婆玩了好几盘，胳膊都有点累，所以录视频的时候已经没有表情了。。

买Token就投资自己

上篇文章我说，互联网已死，Agent永生。

意思不是说互联网真的死了，互联网又不是活体动物，不会死。

而是说互联网已经如死水一潭，我们不要在死水里找机会了。

Agent是三个指数叠加的增量，最值得关注。

人最重要的事情就是要关注重点，屏蔽噪音。

既然最重要的是Agent，它的燃料又是Token。

那就要舍得花钱，舍得买Token。

舍得给自己的Agent加满油，它才能跑在最前面。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

GLM-5涨价背后的真相：算力稀缺才刚刚开始

大 家 都 在 搜

大家都在搜