扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-02-13 11:27

GLM-5涨价背后的真相:算力稀缺才刚刚开始

本文来自微信公众号: AGENT橘 ,作者:AGENT橘,原文标题:《GLM-5 涨价背后的真相:算力稀缺才刚刚开始》


昨天上午,智谱GLM-5的Coding Plan涨价30%。


这个事情引起了很大的讨论,我也非常理解,毕竟价格是最敏感的话题。


当时我的第一反应是:终于还是涨了。


虽然很反共识,但我一直预期Token会涨价,这个信号是对我预期的一个确认。


模型越强,Token越稀缺,价格越贵。


智谱在商业化上确实显得不够成熟,他们最大的失误就是低估了模型能力进步带来的指数级增长,一开始给的plan太大方,现在模型更大了,算力不够,要么砍用量,要么涨价,没有商业模式支撑的服务无法健康长久。


昨晚一个朋友因为没买到Coding Plan,来借我的API key。


这时候我才意识到,这次涨价之后,依然是限购状态。


涨价+限购,一代人有一代人的茅台?


涨价背后的真相


要理解这次涨价,只需要看清一个结构性矛盾:供给是线性的,需求是指数的。


先看供给侧。



Google 2026年的资本开支相比2025年,差不多翻倍。


这已经是全球最有钱的科技公司之一,倾尽全力在砸算力基础设施了。


你不可能让台积电明天就多造出十倍的芯片。


供给侧的增长曲线,是一条缓慢爬升的直线。


再看需求侧。


需求不是一重指数,是三重指数叠加。


第一重指数:Coding模型能力提升解锁新场景。特别是从Vibe Coding到严肃的Agentic Engineering这一跃升。每一次能力提升,都打开一片10倍的Token消耗场景。


第二重指数:Agent数量本身在爆发式增长。在未来一个人背后可能有10个、100个Agent在7×24小时不间断地调用模型。人会睡觉,Agent不会。人一天工作8小时,Agent一天工作24小时。Agent的数量乘以Agent的工作时长,这个数字的增长速度远超任何人类用户的增长。


第三重指数:Seedance 2.0,Nano Banana Pro这样的多模态模型的Token消耗量远超纯文本。视频生成、图像理解、代码工程,每一个场景的单次消耗都是纯文本对话的几十倍甚至上百倍。当这些场景被模型能力解锁之后,Token的消耗量会出现断崖式的跃升。


三重指数叠加在一起,面对的是一条线性增长的供给曲线。


供给翻2倍,需求翻10倍甚至100倍。


这种结构性的失衡,在可预见的未来一年内,只会增强不会逆转。


所以涨价不是智谱的选择,是物理定律的选择。


有人天真地说,不用担心,大厂会打价格战的。


你见过卖金铺打价格战吗?


稀缺的东西,不存在价格战。


GLM-5凭什么值这个价


涨价30%需要底气,这种底气凭什么?


看三件事就够了。


第一,Coding能力逼近Claude Opus 4.5。


GLM-5几个Coding能力的跑分上,已经追上了Sonnet 4.5,开始朝着Opus 4.5逼近。在多个权威指标上都是开源模型的SOTA。跟自己比,从GLM-4.7到GLM-5,内部评估的编程任务平均增幅超过20%。


除了指标的提升外,GLM-5不只是"写代码更好了",而是从写代码进化到了写工程。它能自主完成后端重构、深度调试、长程规划与执行,已经在朝着资深架构师的方向迈进。



第二,Agent能力是真正的长程任务执行。


在BrowseComp、MCP-Atlas、τ²-Bench三个Agent评测基准上,GLM-5均为开源第一。在Vending Bench 2的模拟经营测试中,GLM-5经营一年期的自动售货机业务,最终账户余额达到4432美元,接近Opus 4.5。


有些榜是可以刷的,但模拟经营榜,代表模型真的能"做事"。长程任务中的目标一致性、资源管理、多步骤依赖处理,是Agentic Engineering时代的核心能力。



第三,模型参数翻倍,推理成本也提高了。


GLM-5的参数规模从355B(激活32B)扩展到744B(激活40B),预训练数据从23T提升到28.5T,以MIT License完全开源。在顶级模型中,这种开放程度极为罕见。同时值得注意的是,GLM-5已经完成了与华为昇腾、寒武纪、摩尔线程等国产算力平台的深度适配。在全球算力稀缺的大背景下,这件事的战略意义非同小可。


总之,用户付的钱多了30%,但拿到的能力涨了远不止30%。


人是为更好的结果买单,所以涨价完全没毛病。


实测体感


GLM-5是第一个国内敢去对标Claude Opus的模型


我个人测试,目前的水平肯定是达不到Opus 4.6水平的


但我发现GLM-5的思维方式和Opus 4.6非常像,思考深度非常深,有时候我看着这两个模型的思考国产,都会非常惊叹太聪明太全面了。


但遗憾的是GLM-5还不具备Opus 4.6的独立思考能力,会和ChatGPT一样顺着我的意思说。


这是我用GLM-5写的一个体感小游戏,叫《抓马》


能写出直接可玩的游戏,还是非常强悍的。


我和老婆玩了好几盘,胳膊都有点累,所以录视频的时候已经没有表情了。。


买Token就投资自己


上篇文章我说,互联网已死,Agent永生。


意思不是说互联网真的死了,互联网又不是活体动物,不会死。


而是说互联网已经如死水一潭,我们不要在死水里找机会了。


Agent是三个指数叠加的增量,最值得关注。


人最重要的事情就是要关注重点,屏蔽噪音。


既然最重要的是Agent,它的燃料又是Token。


那就要舍得花钱,舍得买Token。


舍得给自己的Agent加满油,它才能跑在最前面。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

大 家 都 在 搜