扫码打开虎嗅APP
本文来自微信公众号: 夸克点评 ,作者:王如晨
今天的热点话题之一是,阿里云、百度智能云明天就要调价了。几周后,腾讯云也会跟上。涨幅5%到34%不等。
事实上,这一幕,年初阿里云PolarDB开发者大会上,我已预判到。
当时我将一个问题抛给了时任阿里云资深副总裁、数据库产品事业部一号位的李飞飞(前不久已升任阿里云CTO)。基本逻辑如此:过去几年,阿里云每年都会有降价动作,而眼下存储、算力价格高企,接下来如何如何。当时还问他,这个过程中PolarDB会发挥什么作用。
他当时表面没直接回答。但强调的两点等于给了答案:一是存储高价态势可能持续3到5年,二是未来一段,全球token量将大爆发。
不过,此刻,我想说说另一个话题。至少过去10多年,云计算整体价格只降不涨,而今天集体向上调价的动作,可能意味着一种长期趋势的反转。
直接破题吧。BAT算力涨价下的token经济学,是否将导致互联网业聚合理论失效,并重构传统规模经济效应?
先来说说聚合理论。
当年,Ben Thompson提出聚合理论时,核心逻辑简单到近乎粗暴:零边际成本加上需求端,谁能以最低成本连接、留存最多用户,谁就可能全盘通吃。
BAT当年的崛起,几乎就是这逻辑的教材。
彼时,算力需求远不如今日壮观,相对充足,成本下行趋势下,平台的扩张一度无边界。而它与流量红利结合,聚合理论的适配堪称完美。
但经过几十年的探索后,生成式AI时代来了。
这时代对聚合理论的第一个冲击,就是将零边际成本效应给破了。每一个token再小,都要吃掉点GPU;每一次推理能耗再低,也要耗电。而高需求的用户,带来的就不纯是规模经济效应了,而是边际成本的非线性暴涨。
看到一些人喜欢套用杰文斯悖论。
DeepSeek们确实把单个token的成本打了下来。但需求不是跟着降的,是跟着炸的。
AI应用从对话升级到做事,一个任务吞掉的token量,比一次对话多了10到50倍。模型越便宜,用的人越多,场景越重,算力的总消耗反而像弹簧压缩后的反弹,比涨价之前还猛。效率提升没有带来资源节省,带来的是需求的几何级爆炸。BAT这次涨价,与其说是商业决策,不如说是现实账单送到了门口,不得不开。
第二个冲击,是把所有人都留住这件事,正在变成一种负担。
涨价之后,BAT各自的动作,几乎是聚合理论的反向走法。阿里云把算力按token计量,优先投向高毛利企业服务,不再执念于份额;百度智能云用价格主动筛人,大B客户留着,零散流量让它自然流失;腾讯云把有限的算力压在广告和游戏,这两块回报看得见摸得着。有个腾讯的朋友提过,去年下半年元宝体验一度明显弱化,不是不想做好,是算力资源要先保核心业务,C端产品只能往后排。其他平台的处境类似,有的甚至更紧。
前端多聚合一个用户,后端就多一份压力,平台只能相对地放弃更多。算力的稀缺性,把无差别服务所有人这件事,从战略优势变成了财务陷阱。聚合理论赖以成立的那个前提,用户是无差别的、边际成本可以趋近于零,开始松动了。
如果只看到聚合理论在动摇,很容易忽视另一面。传统规模经济受到的冲击,同样是结构性的。
固定成本分摊,产量越大,单位成本越低,利润空间越来越厚。互联网时代,这套逻辑运转得极为顺畅。但在AI密集的场景里,有个关键的齿轮咬错了。规模越大,推理请求越多,算力消耗越密集。而且用户不是均质的,重度用户和轻度用户消耗的算力,可能差出几百倍。传统规模经济里那条向右下方倾斜的成本曲线,在AI密集的场景里,正在弯向相反的方向。
还有更深的一层。算力不是水,不是可以无限复用的通用资源,它是有机会成本的战略要素。每一块GPU,都在广告、游戏、大模型推理之间被争抢。把算力砸进低变现的场景,就意味着让出了高回报的入口。这就解释了,为什么规模不断扩大的平台,还是不得不涨价。规模经济没有失效,是它赖以运转的前提条件,低廉且可无限扩展的边际资源,先垮了。
两股力量从两个方向同时压缩平台的战略空间,最终指向同一个结果,结构性分层。
分层不是简单地放弃某类用户。
需求侧,平台主动识别高价值需求,对不同用户赋予不同的资源权重;供给侧,不再追求规模扩张带来的全面成本优势,而是在特定高价值场景里往深里扎。
腾讯押广告和游戏,字节靠抖音的现金流养算力,华为昇腾接住国产替代的缺口,阿里云向高毛利企业服务倾斜。路径各不相同,但标尺一致,以价值密度而非市场份额作为资源配置的尺度。规模经济在AI时代的变形,不是越大越好,是越精越好。
等算力供给跟上来,这一切会不会重新反转?
我认为,对于云计算、AI平台而言,这个趋势很难重新大规模逆转。
供给端,高端芯片的出口管制没有松动的迹象,国产算力的迭代需要时间,稀缺是长期状态。需求端,AI从对话向自主完成任务演进的过程,本身就是需求的持续裂变,今天看起来已经庞大的规模,在未来几年可能只是起点。价格一旦涨上去,就算规模经济后来部分回归,云计算平台也很难再把价格降回来。这不只是定价惯性,是成本结构被稀缺永久性地改写之后,棘轮不会倒转。
海外的走向也差不多。Anthropic已在调整策略,优先服务高付费客户;Meta靠广告养着开源,其他业务早已主动筛选而非无差别聚合。
当然,说token经济学重构了聚合理论与规模经济,说的首先是AI密集的领域。内容、本地生活、传统电商,算力需求不那么沉重的地方,零边际成本的逻辑依然成立,规模经济照旧有效,聚合依然是有力的竞争策略。这个边界是存在的,只是随着AI向更多行业渗透,它在持续收缩。
往更远处看,这是一个反复出现的历史规律。每当某种关键资源从充裕变为稀缺,整个社会的组织逻辑,就要经历一次重写。
工业革命时代,能源稀缺催生了泰勒制,大工厂靠效率至上主导了整整一个世纪;二十世纪下半叶,石油危机打断了廉价能源驱动无限增长的神话,逼出了节能技术和产业分工的大重组;互联网和移动互联网时代,带宽与存储的成本趋近于零,聚合理论和规模经济共同主导了黄金三十年。今天,轮到AI算力了。
稀缺改变的,不只是定价,是竞争的底层逻辑。零边际成本让位于算力稀缺,流量红利让位于机会成本,规模至上让位于价值密度。
这轮涨价是一个早期信号,不是终点。算力的分配方式,将直接决定哪些人、哪些行业、哪些区域,能够优先进入AI时代的红利区。
这已经不只是商业竞争的问题,而是关于机会与公平的命题。
很多过去看着稳固的利益版图,将会经历松动,很多人会产生焦虑。但这场变化有强大的重构力,并不意味着倒退。尤其对中国而言,这是大国走向成熟的必经之路,是从大而全走向精而深的历史性转场。
草莽叙事的时代正在收尾,一切都在向前。
夸克,最小的粒子,微末的洞察。