扫码打开虎嗅APP
本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:郑远方,题图来自:NVIDIA
日前,一则有关“2美元/小时出租H100:GPU泡沫破灭前夜”的报道引发国内市场高度关注。相关文章指出:
英伟达H100 GPU在2023年3月上市之后,因需求激增供不应求,其租赁价格从最初的每小时4.7美元一度飙升至每小时8美元以上。但今年以来,H100开始“供过于求”,每小时租赁价格降至2美元左右。
价格下跌是多方因素导致的:1)有些长期预订H100的公司完成模型训练之后,转售闲置未使用的算力;2)许多公司不再从头训练新模型,转而微调开放模型,算力需求大幅降低;3)专注构建大规模基础模型的新创公司数量大幅减少;4)H100的替代品出现,如AMD和英特尔GPU,等等。
对这篇报道进行溯源后可以发现,海外主流媒体及主要科技媒体暂未进行相关报道,原报道标题为《$2 H100s:How the GPU Bubble Burst》(2美元H100:GPU泡沫是如何破灭的),来自一个名为Latent Space的网站,原文作者为Eugene Cheah。
根据网站介绍,Latent Space主要聚焦于AI,形式集内容讯息、博客、社区为一体,由swyx及Alessio Fanelli共同主持,前者的社交平台账号并未给出带有具体身份自我介绍,后者则为早期风投公司Decibel VC的合伙人和CTO。
原文作者Eugene Cheah,是初创公司Featherless.Ai的CEO。
据Cheah在“GPU泡沫”一文原文末尾的介绍,Featherless.Ai目前托管着全球最大的开源AI模型,“每月10美元起,可立即访问,无限制请求,价格固定;可通过无服务器方式即时推理,无需昂贵的专用GPU”。
一、H100租赁价格下跌=GPU泡沫破灭?
“GPU泡沫”一文原文中有张配图,那是法国艺术家让-莱昂·热罗姆在1882年创作的油画《郁金香狂热》(Le Duelàla tulipe)。
这幅画描绘了有记录以来的历史上第一次投机泡沫——17世纪荷兰的“郁金香狂热”,郁金香的价格在1634年持续攀升,并于1637年2月崩盘,投机者手中只剩下最初投资额的5%。
三百多年前的投机泡沫会否再次上演?这个问题牵动着每一位AI投资者的神经,或许也是这一次“H100租赁价格下跌”一文引发高度关注的原因。
从算力租赁商Vast.ai网站报价可以看到,1x H100的一小时租赁报价确实已经在2~3美元的区间内。
Vast.ai报价
但H100的租赁价格下跌,真能和“GPU泡沫破灭”画上等号吗?
一方面,从Eugene Cheah的文章来看,“H100价格下跌”可能用“分化”来形容更为合适——持续下降的主要是小规模集群的租赁价格,相较之下,大规模算力集群的价格则可能依然维持在较高水平。
而这些大规模算力集群的背后,多是诸如特斯拉、微软、OpenAI一类的科技巨头。Omidia数据显示,H100发布之后的那个2023年第三季度,其出货量达到65万张,其中,仅Meta和微软就分别拿下了15万张,占比接近一半。
另一方面,电子产品都有更新迭代周期,GPU芯片同样如此。之前英伟达下一代GPU Blackwell系列传出设计存在缺陷,可能延迟出货。但摩根士丹利上周发布报告称,Blackwell的生产正在“按计划进行”,且未来12个月左右的供应已经售罄,这意味着现在下订单的客户要到2025年底才能收到货,“这将继续推动对现有Hopper架构产品的强劲短期需求”。
H100租赁价格并非骤然暴跌,波动已有时日。从A100到H100,从H100到H200,再到未来的Blackwell,新品出世势必带来前代产品的没落,更不用说,Blackwell的算力成本有望比Hopper进一步降低。
黄仁勋这位英伟达“掌舵人”也在日前现身说法。在接受Altimeter Capital采访时,他强调,对英伟达的持续看涨与互联网泡沫顶峰时期围绕思科的狂热完全不同。英伟达正在“重塑计算”,未来将是“高度机器学习”的时代。
“摩尔定律已经基本宣告终结”,他表示,为了提供必要的算力以跟上未来计算密集型软件的步伐,未来4~5年内,现有数据中心将需要价值约1万亿美元的GPU来实现升级。
必须承认的是,“AI泡沫”论的警钟敲了又敲,“AI投资回报难达预期”的质疑声音一浪高过一浪,一边是OpenAI抱怨算力上线不及时不够用、英伟达新品售罄,另一边是算力租赁价格不断下降,还有公司“甩卖”GPU。
但局部、短期的算力过剩或短缺,似乎已难以代表AI的全盘局面,对于供需两方、多空两边来回博弈的AI领域来说,在硬件端之外,或许亟待更多新故事。
本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:郑远方