扫码打开虎嗅APP
本文来自微信公众号: 芯世相 ,作者:汤之上隆
近年来,不少人士将AI相关投资的扩张趋势视为"AI市场存在泡沫"。但笔者并不认同这种观点,现将理由阐述如下。
01
人工智能并非“泡沫”
云服务厂商的资本性支出(Capex),已经膨胀到一个无法再用“高速增长”这种温和词汇来形容的规模。云厂商Top 8的设备投资额,从2021年的1451亿美元,预计将在2026年扩大到6020亿美元,增长超过4倍。这样的增幅,已经明显超出了常识范围。
即便如此,市场上仍不断有人低声嘀咕:“反正又是泡沫吧。”“总有一天会崩的。”这是一种熟悉的、逃避现实的说法。但这种判断并没有事实依据,甚至连乐观臆测都算不上,只是一种心理上的自我安慰。因为这一次的投资扩张,并不是由景气、情绪或投机推动的,而是被数量级完全不同的计算需求——一种近乎物理法则的力量——所驱动的。
决定性的差异在于:生成式AI的计算负载,并不是“搜索的延伸”,而是处在完全不同维度的“训练与推理”。后文将详细说明,Google搜索主要依赖CPU即可完成,而ChatGPT的推理则是以GPU为核心的大规模矩阵运算,其计算量高出1万到10万倍。
也正因为如此,云厂商并不是“乐于”增加投资,而是如果不增加投资,就会被竞争淘汰。一个无法运行生成式AI的云平台,将不再具备存在价值。因此,投资不会停止,准确地说,是无法停止。
本文将论证:当前正在发生的,并非所谓的“AI泡沫”,而是一场将不可逆地改变半导体市场重心的“AI趋势”。
02
云计算投资以异常速度膨胀
首先,让我们直面现实。图1展示了云服务厂商Top 8的设备投资变化趋势。这里的Top 8包括:美国的Amazon(AWS)、Microsoft(Azure)、Google(Google Cloud)、Meta(原Facebook)、Oracle(OCI),以及中国的阿里云、腾讯云、字节跳动等。

图1云制造商Top8企业的设备投资;来源:基于TrendForce数据由笔者制作
如前所述,这8家公司的设备投资,将从2021年的1451亿美元,膨胀至2026年的约6020亿美元,超过4倍增长。这已经不是“增长”可以形容的了,而是一种加速。
2022年至2023年间虽曾出现下滑,但绝不能因此掉以轻心。观察2024年后的增长趋势便可发现,云服务商已"进了一步又一步"。而这波投资热潮,恰恰发生在美国OpenAI发布ChatGPT之后。
也就是说,他们投资生成式AI并非因为它是“下一个金矿”,而是因为生成式AI作为颠覆现有基础设施需求的“游戏规则改变者”,迫使他们不得不投资。
推动云投资膨胀的因素当然很多:数据中心建设、土地、电力、冷却、网络、存储、安全……但如果用一条主线贯穿这些因素,其本质只有一个——算力需求。正是算力需求的爆炸式增长,带动了其他所有成本的同步膨胀。所谓云投资的扩大,本质上就是一场围绕算力资源的大规模争夺战。
而当前的算力需求,已经无法用传统Web服务或搜索服务的延长线来解释。生成式AI并不是向云平台“再要一个胃口”,而是在要求把整个胃袋本身彻底做大。
03
Google搜索与ChatGPT:
看似相同,实则完全不同
在这里,有必要纠正一个很明显的误解,那就是:“对用户来说,Google搜索和生成AI不都是提问、然后得到答案吗?”
诚然,如图2所示,用户的操作行为具有相似性。无论是谷歌搜索还是生成式AI,人类的操作方式几乎如出一辙。然而,全球拥有30亿以上用户的谷歌搜索正逐渐向ChatGPT等生成式AI转移,其用户规模正持续扩大至10亿人。

图2人类在进行一次Google搜索与一次ChatGPT5提问时所执行的操作
笔者本人也是从去年开始使用ChatGPT的付费版本,之后使用Google搜索的频率明显下降。原因很简单:ChatGPT更方便。全球大量用户正在意识到生成AI的便利性,这正是其用户数持续增长的根本原因。
真正关键的问题在于:即便是同样的“问题”,Google搜索与ChatGPT等生成AI,在云端所执行的计算却完全不同。
这一决定性差异体现在图3中。Google搜索本质上是以CPU为中心的索引检索;而ChatGPT的推理,则是以GPU为核心的大规模矩阵运算。从计算量(FLOPs,浮点运算次数)来看,Google搜索大约在10亿到100亿量级,而ChatGPT一次推理则达到10万亿到1000万亿,两者相差高达1万到10万倍。
图3谷歌单次搜索与ChatGPT5单次提问的计算对比;来源:基于笔者调查与推测
不仅如此,与Google搜索相比,ChatGPT在服务器占用时间上高出10到100倍,能耗高出10到200倍,CO₂排放量同样高出10到200倍,而单次推理的成本估算甚至高出50到2000倍。
换言之,生成式AI绝不是“更高级的搜索”。它是一种完全不同的计算形态,承载着完全不同级别的负载。因此,生成AI的普及,意味着云平台所处理的“计算单位”正在急剧放大。这不是靠压价、谈判或销售技巧就能解决的问题,而是物理层面的必然结果——需要GPU这样的AI芯片,需要电力,需要冷却,需要高速网络,需要高带宽内存(HBM),甚至还需要更先进的封装与互连技术。
市场上常听到一句话:“将来计算效率会提升,负载会变轻。”效率提升确实会发生,但问题在于,生成式AI应用扩张、使用频率提升、模型性能进化的速度,远快于效率提升的速度。即便单次计算因优化而变轻,只要社会整体使用次数增长10倍,总计算量仍然会增加。再考虑到输入更长、输出更长,以及图像、视频推理的普及,计算负载只会变得更加沉重。
因此,云投资持续扩大的原因,并不是“过热”,也不是“盲目乐观”,而是算力需求结构本身发生了变化。而且,投资一旦停止,就意味着失败已经注定。云厂商持续加码投资,并非源于勇气,而是源于恐惧——被时代抛下的恐惧,正迫使他们将投资油门一踩到底。
04
AI与过去的泡沫有着决定性的不同
那么,接下来进入核心问题:当前这种状况,究竟是不是泡沫?
先给出结论:用“泡沫”来概括这一次的现象,是完全错误的。原因在于,过去的泡沫与这一次相比,需求的性质在根本上就不一样。下面尝试用定量方式来说明这一点。
图4展示了全球半导体出货金额及其同比增长率的变化趋势,其中标注了Windows 95泡沫、IT泡沫以及存储泡沫等阶段。从这张图可以清楚地看到,过去的泡沫都有一个共同特征:在急速增长之后,紧接着就是急剧下滑。这是因为当时的需求高度依赖于“短期需求激增”和“库存调整”。

图4全球半导体出货金额与同比增长率;来源:基于WSTS数据,由笔者整理
接下来,图5A将Windows 95泡沫、IT泡沫、存储泡沫,以及当前正在发生的AI热潮(这里暂且称之为“热潮”),在N年至N+3年的同比增长率并列进行比较。再将其绘制成图5B后可以看到:Windows 95泡沫在41.7%的高增长之后,紧接着出现了-8.6%;IT泡沫在36.8%之后暴跌至-32.0%;存储泡沫也在13.4%之后跌至-12.0%。也就是说,“快速升温—迅速崩塌”的周期性特征非常明显。

数据来源:基于WSTS数据,由笔者整理
与此形成鲜明对比的是生成式AI热潮。其增长轨迹为:2023年-8.1%,2024年19.7%,2025年22.5%,而2026年几乎可以肯定不会出现负增长。正如许多业内人士所指出的那样,在2030年之前,生成式AI相关需求出现负增长的可能性极低。
换言之,当前正在发生的并非“泡沫”,而是一种单一但极其庞大、极其强劲的“趋势”。
这一次与过去最大的不同在于,需求的源头并不是“PC普及”或“智能手机等通信设备的换机周期”这种一次性消费波动,而是算力需求本身正在基础设施化。生成式AI并不是某个产品卖完就结束的生意。
AI正在渗透进社会的几乎所有业务流程,被嵌入到各种服务中,与搜索深度融合,成为企业活动中生产力的底座。而这个底座,是由极其沉重的计算构成的。在这种前提下,云计算投资不再是“景气周期中的热度”,而是作为一种社会结构本身固定下来。
从这个意义上讲,把生成式AI称为“泡沫”的观点,本质上是在逃避现实、依赖过去的经验记忆。这一次发生的事情,在以往任何一本产业教科书中都找不到对应章节。
05
面向2030年,投资仍将持续增长
那么,云服务厂商Top 8的设备投资,究竟会膨胀到什么程度?图6给出了云厂商Top 8在数据中心领域的投资预测,并分别列出了悲观、基准和乐观三种情景。
图6云服务厂商Top 8的数据中心投资预测;来源:TrendForce新闻稿及笔者预测
这里需要特别注意的一点是:即便在悲观情景下,投资规模依然呈现持续累积的趋势。原因在于,生成式AI已经不再是“锦上添花的奢侈品”,而是参与竞争的基本条件。
而生成式AI时代的云竞争,其残酷性正体现在这里:一旦停止投资,企业并不会因为“降低支出”而改善利润率,反而会在AI性能上落后,进而失去客户,最终丧失平台本身的价值。也就是说,投资放缓并不是理性的经营判断,而更接近于一份失败宣言。
事实上,投资回收本身并不轻松。GPU价格高昂,HBM同样昂贵,电力供给紧张,散热难度极高,供应链结构复杂。尽管如此,投资仍然无法停止,其根本原因在于:在讨论投资回报率(ROI)之前,市场已经形成了一种结构性现实——没有计算能力的参与者,将直接被淘汰出局。
最终,云计算投资已经不再是“为未来下注”的行为,而是变成了“守住当下”的行为。只要这种结构存在,面向2030年,投资规模持续增长,几乎是一件顺理成章的事情。
06
数据中心用逻辑芯片市场快速扩张
云计算投资的持续扩大,直接推动了半导体市场整体规模的增长。其中,数据中心用Logic(逻辑芯片)无疑是未来增长确定性最高的领域。
图7给出了数据中心用Logic在2024年至2030年的市场预测。从中可以看到,GPU市场将从1000亿美元增长至2300亿美元以上,规模翻倍;与此同时,AI ASIC的市场规模预计将从90亿美元激增至840亿美元,增长超过9倍。

图7数据中心用Logic的市场预测(2024-2030年);来源:主要基于Yole Group的预测数据,由笔者整理
这里有一点绝不能忽视:生成式AI并不会永远停留在“NVIDIA GPU一统天下”的状态。超大规模云厂商(Hyperscaler)天然厌恶对单一供应商的依赖,因为那意味着丧失价格谈判能力。正因如此,他们会转向特定用途的AI ASIC,以实现“在不牺牲、甚至提升性能的前提下降低成本”。而在这一领域,Broadcom承担了大量芯片设计工作。
换言之,AI半导体市场并不会是“只有GPU的黄金时代”,而是将演变为“以GPU为核心支柱,同时AI ASIC(以Broadcom为代表)迅速壮大,形成双支柱结构”的市场格局。即便GPU依然是主角,AI ASIC也必然会高速增长——这正是数据中心Logic市场的真实面貌。
07
存储将长期处于“供不应求、价格高企”的状态
在生成式AI所“吞噬”的所有半导体品类中,存储是受冲击最为剧烈的一个。图8展示了存储市场在2024年至2030年的预测情况:DRAM市场规模将从970亿美元增长至1940亿美元,几乎翻倍;其中,HBM的市场规模预计将达到980亿美元。

图8存储市场预测(2024→2030年);来源:主要基于Yole Group的预测数据,由笔者整理
也就是说,到2030年,HBM将占据DRAM市场的一半。这并不仅仅是市场规模扩大,而是意味着存储产业主角的更替。
此外,从图9可以看到,DRAM与NAND的现货价格在2023年至2026年间持续大幅上涨。在这里,那种“价格上涨→扩大产能→市场回归平稳”的旧时代常识已经不再适用。HBM的扩产难度极高:良率提升困难,涉及先进封装,设备与材料制约重重,供应要追上需求绝非易事。
图9 DRAM与NAND现货价格上涨趋势;来源:基于TrendForce数据,由笔者整理
再加上,存储厂商正在将资源和产能更多地倾斜至AI服务器领域——原因很简单,那里利润率更高。结果就是,PC和智能手机用的通用型存储供给被压缩,价格随之上升。也就是说,AI的扩张正在为存储市场内生性地嵌入“长期紧缺”和“价格高位运行”这两种特征。
归根结底,存储短缺不会被彻底解决,价格也将持续高企。这并非“偶发的异常现象”,而很可能成为AI时代的新常态。
笔者本人在去年12月,时隔6年更换了一台PC(而且相当仓促)。原因在于,DRAM和SSD价格已经开始明显上涨,而且这种上涨在未来很可能会长期持续。因此,作者判断:在PC厂商还有存储库存的阶段尽早购买,才是更理性的选择。随着存储价格的上行,PC和智能手机的终端价格也必然上涨。如果晚半年再买,PC价格翻倍的可能性并非不存在。笔者或许只是“险险躲过了一劫”。
08
台积电的“赚钱主力”从N5转向N3
乘着这股巨大的“AI浪潮”,最有可能、也最有效率实现盈利的半导体厂商,恐怕非台积电莫属。图10展示了台积电按制程节点划分的营收变化趋势,可以清楚看到,其“赚钱主力”正从N7转向N5,并进一步转向N3。

图10台积电各季度按节点划分的营收;来源:基于TSMC Historical Operating Data,由笔者整理
接下来,图11展示的是按节点划分的晶圆投片量变化趋势。从中可以看出,未来会持续增加的只有N5、N3和N2,其余制程节点则呈现下降趋势。这并不是一句“先进制程至关重要”的漂亮口号,而是一个现实:只有先进制程在增长。也就是说,台积电已经蜕变为一家几乎只靠先进制程赚钱的晶圆代工厂。

图11台积电各季度按节点划分的晶圆投片量(2025年Q4为预测);来源:Claus Aasholm《One Peak short of Twin Peaks》,Semiconductor Business Intelligence,2025年10月22日数据及笔者推算
生成式AI所需的计算量极其庞大,因此必须使用大量高性能AI芯片。而这又离不开先进制程所支撑的巨大产能。如今,能够满足这一需求的厂商,几乎只剩下台积电一家。正是这种简单而直接的因果关系,正在成为半导体产业的“引力中心”。
09
N3的主角:从苹果转向NVIDIA与Broadcom
接下来才是真正有意思的部分。过去,推动台积电先进制程发展的最大客户毫无疑问是苹果,但这一格局正在发生动摇。
图12和图13展示了TSMC N3制程按客户划分的晶圆投片量预测。从中可以看出,在2025-2026年期间,NVIDIA和Broadcom的投片量将持续增加,并呈现出超过苹果的趋势。

图12台积电3nm制程按企业划分的晶圆投片量预测(折合月产1000片);来源:基于TrendForce的Joanne Chiao在《2026年代工市场展望——先进制程的优势与成熟制程的饱和》(2025年12月16日)研讨会资料,由笔者整理

图13台积电3nm制程按企业划分的晶圆投片量预测;来源同上
这并不仅仅是客户排名的变化。从先进半导体的发展历史来看,这意味着产业已经从“由智能手机处理器拉动先进制程的时代”,转向“AI芯片主导先进制程的时代”。
苹果使用先进制程,是为了提升消费者体验;而NVIDIA与Broadcom使用先进制程,则是为了争夺云计算的主导权,这种差异非常明显。AI芯片并不是“卖出去就结束”的产品,而是作为持续运行的基础设施不断扩张。因此,对先进制程的需求具有极强的粘性。
台积电的赚钱主力转向N3,并不仅仅说明台积电很强,更重要的是:AI重塑了先进制程的需求结构。
而在台积电已于2025年第四季度开始量产的N2制程上,同样的情况也很可能会再次上演。最早采用N2的客户或许仍然是苹果,但半年之后,NVIDIA与Broadcom很可能就会成为主角。换句话说,苹果扮演的是为最先进产线“打头阵”的角色,而随后,作为“重量级选手”的NVIDIA与Broadcom将占据大多数产能,并为台积电的利润做出更大的贡献。
10
真正的瓶颈在CoWoS
然而,AI半导体的成长面临着多重瓶颈。其中最为严峻的,就是CoWoS等2.5D封装的产能(Capacity)。
图14展示了2.5D封装产能的变化趋势。AI半导体并不是仅靠先进制程制造出来的“单颗芯片”就能成立的产品,它必须与HBM结合,形成一个系统级集成来实现性能。这一系统级集成不可或缺的关键,正是CoWoS。只要CoWoS的产能不足,AI半导体的供给紧张就不可能真正缓解。

图14 2.5D封装产能的变化趋势;来源:TrendForce的Joanne Chiao,《2026年代工市场展望——先进制程的优势与成熟制程的饱和》(2025年12月16日)研讨会资料
也就是说,当下AI市场的所有制约,最终都会归因到一点:CoWoS不够用。
但这里存在一个与直觉相反的未来。如果CoWoS的瓶颈被解除,投资会因此趋于冷静吗?——答案恰恰相反:投资只会进一步放大。
原因在于,目前有大量云厂商“想买却买不到”的AI半导体需求,被供给瓶颈强行压制着。一旦供给限制解除,被抑制的投资将瞬间喷涌而出。云厂商会趁机集中采购此前无法获得的AI芯片,加速建设AI数据中心,竞争也将随之进一步白热化。投资非但不会“降温”,反而极有可能进入下一个更激进的阶段。
11
这不是泡沫,而是半导体产业的“地壳变动”
本文的结论其实很简单,可以归纳如下:
1)云厂商投资持续扩大的根源,在于生成式AI所需的计算量呈数量级跃升;
2)当前正在发生的,并非类似Windows 95泡沫、IT泡沫或存储泡沫那种“以崩溃为前提”的泡沫,而是规模巨大、力量强劲的AI趋势;
3)在这一AI趋势推动下,逻辑芯片与存储市场持续扩张,存储价格也因AI转型而维持在高位;
4)台积电的先进制程被AI全面占据,N3的主角正从苹果转向NVIDIA与Broadcom;
5)AI的最终瓶颈在CoWoS,一旦这一瓶颈解除,云厂商的投资将进一步放大,甚至走向“暴走”。
生成式AI所创造的,并不是泡沫,而是一种趋势。正是这种趋势,正在引发半导体产业的“地壳变动”。而地壳一旦发生位移,就不可能再回到原来的状态。