扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2025-03-18 15:27

AI的杰文斯悖论,离成立还差一个英伟达

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究


杰文斯悖论不是天然成立的。在AI的叙事中,要让算力用得越多,就要让算力变得更便宜,也要让AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门,黄仁勋要在本届GTC上,让市场再次相信他。


AI正在从技术变革和基础设施的部署期,向规模化的商业应用期转变。对于GPU的需求也在发生根本性的变化,即从抢购GPU快速部署算力和技术,到商业应用寻求更具性价比的算力。老黄苦心经营的卖方市场,并非一成不变。需求在呼唤新的创新。


算力成本下降的趋势已经相当明显。Deepseek从软硬件协同层面起了带头作用,阿里千问和百度文心接力,挑起了价格战。但是,硬件层面的算力成本也需要快速下降,即全生命周期内总持有成本(TCO)的下降。它既包括单位算力成本的下降,决定了算力的资本开支(Capex),也包括单位性能能耗的下降,决定了算力的运营开支(Opex)。


如果只是降低单位算力的成本,也就是每花一美元获得的算力的多少,很快就会遇到电力的天花板。尤其是在美国,存量电力基础设施老化,增量建设缓慢,无法支撑数据中心快速扩张。EpochAI认为,前沿模型训练首先遇到的瓶颈就是电力问题,当前的预训练之路,在2030年之前就会终结。推理规模落地,尤其是DeepResearch这样昂贵的智能体技术,需要更高的算力消耗,也就更快触及电力瓶颈。



对英伟达来说,一旦算力触及了电力瓶颈,想要卖出更多的AI芯片,就要降低它的单位算力能耗。否则,整个行业都将像DeepSeek学习,在现有硬件的基础上,通过软硬件协同或模型优化,压榨出更多的算力——这样对于更强大的芯片的需求会变得相对淡定。


事实上,即使没有触及总电力供给的瓶颈,当R1推出之后,美国云巨头与AI应用企业就迅速将其部署于自己的服务器或应用之上。AI走向商业化,企业就有强烈的降低成本的驱动力,要么是更便宜的资本开支,要么是更便宜的运营开支。


CoreWeave曾透露,电力大约占其基础设施成本的10%。该企业大量采购了英伟达AI芯片,披露该数据的时候,算力主要来自Hopper架构芯片。Semianalysis曾简单地算过一笔账,H100售价3.5万美元,8块H100的服务器约28万美元,它每月电力成本约为648美元(按0.087美元/千瓦时的电价计算,电价更低的地区运营成本相应降低)。如果按6年折旧,那么算力用电成本相当于GPU成本的15%左右。


但是,EpochAI估算,按当前英伟达芯片的发布趋势,到2030年,每花1美元,就能比现在多买到8倍多的算力(FLOP),而驱动这些算力的功耗则会减少4倍,花在电力上的成本相当于GPU成本的40%。即,因为推理应用阶段会在算力中占更大比重,运营成本中的电力成本占比相对上升了。只有比现在更快地降低单位算力能耗——或者在电价更低的地区大规模部署——才能大幅降低未来AI企业的运营成本。


英伟达的芯片越来越“烫手”。A100的热设计功率(TDP)为400瓦,H100达到了700瓦,B200约为1000瓦;多家分析机构预计,即将发布的GB300约为1400瓦,下一代Rubin高达1800瓦。这不仅使得芯片与机架层面频频出现设计与散热问题,量产时间较预期推迟不少时间,更有可能将用户推向拥抱更节能的定制AI芯片。


巨头们已经开始纷纷自研芯片。谷歌找了博通还不够,计划让联发科也试试设计TPU。英伟达的竞争对手越来越多。提升能效,正是下一代芯片与算力系统创新最重要的主题。


从2022年底ChatGPT发布,到2026年下半年Rubin正式量产,以及2027年规模部署,算力基础设施粗放式地建设浪潮,也跨过了5年的周期。按照互联网时代的经验,大模型也是时候进入更节能的阶段了。


前劳伦斯伯克利国家实验室研究人员乔纳森·库米(Jonathan Koomey),在2000年互联网泡沫高峰期,驳斥了几乎与今天一样的“电力炒作”。当时同样有很多人预测,计算机和互联网应用最终将消耗大量电力,从2000年到2005年,数据中心用电量确实翻了一番,但此后增长缓慢,从2010年到2018年,由于芯片系统技术的进步,更是用6%的用量增量支撑了计算量的6倍增长。



库米最近发布报告称,在AI热潮的早期阶段,巨头玩家们争相获得算力部署新兴的技术,效率往往并不是首要考虑,但随着部署限制逐步显现,行业将会用效率来缓解这种限制。尽管摩尔定律,在放缓,登纳德定律(Dennard Scaling)所定义的芯片能效逐步失效,但除了在软件与算法层面寻求优化,硬件仍然可以在定制化、集成化和立体化设计等方向,甚至新的材料或新的计算模式(如量子计算)上进行创新。


谁解决了这个问题,谁从产业中赢得更多的利润。这是黄仁勋需要在即将到来的GTC演讲上,给出一个能源答案。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: