扫码打开虎嗅APP
本文来自微信公众号:半导体行业观察 (ID:icbank),作者:半导体行业观察编辑部,题图来自:AI生成
据路透社报告,Nvidia股票在周一收盘创下历史新高,这家重量级人工智能芯片制造商即将取代苹果成为全球最有价值的公司。
由于投资者押注其当前和下一代人工智能处理器的强劲需求,这家位于加利福尼亚州圣克拉拉的公司的股价当日上涨2.4%,收于138.07美元。今年6月,英伟达一度成为全球市值最高的公司。后来,微软超越了英伟达,这三家科技巨头的市值在过去几个月里一直不相上下。
最新的涨幅使Nvidia的市值升至3.39万亿美元,略低于苹果的3.52万亿美元,但高于微软的3.12万亿美元。Nvidia是Alphabet、微软、亚马逊以及其他新型公司AI竞争中的最大赢家。
由于人工智能热潮,该公司先进半导体的需求旺盛,英伟达股价今年已上涨了179%。相比之下,标准普尔500指数和科技股为主的纳斯达克指数分别上涨了23%。该股本月迄今已上涨近14%。
那么,为什么英伟达能成为赢家?
一、最新芯片全部卖光,客户陷入囚徒困境
来自分析师的最新消息显示,Nvidia即将推出的Blackwell处理器在未来12个月内已经销售一空。摩根士丹利分析师约瑟夫·摩尔(Joseph Moore)在本周接待英伟达首席执行官黄仁勋及公司其他高管后,在一份客户报告中分享了这一消息。
据摩尔称,产品的推出正在按计划进行,Nvidia的Blackwell GPU“12个月内已被预订一空”,这意味着尚未向该公司下订单的客户要到2025年底才能收到Blackwell产品。
Nvidia于今年3月发布了Blackwell GPU系列。
Blackwell GPU采用定制的双光罩极限4NP TSMC工艺制造,GPU芯片通过10TBps芯片到芯片链路连接到单个统一的GPU,拥有2080亿个晶体管。相比Hopper系列的800亿个有所增加,并包括第二代变压器引擎和新的4位浮点AI推理功能。
本周早些时候,微软成为首家部署Nvidia GB200 AI服务器的云服务商,该公司在X上发布消息称:“Microsoft Azure是首家运行Nvidia Blackwell系统并搭载GB200 AI服务器的云服务商。我们正在每一层进行优化,以支持世界上最先进的AI模型,并利用Infiniband网络和创新的闭环液体冷却。”
Google、Meta和CoreWeave也已订购了Blackwell GPU。产品预计将于本季度开始发货,此前曾因意外出现的设计缺陷而延迟发货,但现已解决。
8月,Nvidia首席财务官Colette Kress在公司2024年第三季度财报电话会议上告诉分析师,公司预计2024年最后一个季度将实现“数十亿美元的Blackwell收入”。
在分析师看来,这家半导体公司的客户陷入了“囚徒困境”。
根据TD Cowen分析师Joshua Buchalter所说,在该公司的超大规模客户中,“每个客户都有继续支出的动力,因为不这样做的代价(可能)是毁灭性的。”
Buchalter写道,随着Nvidia向Blackwell芯片系列过渡,这将支持对Nvidia硬件的持续需求。尽管投资者可能对Nvidia能否在Blackwell芯片延迟发布的情况下跟上其“近期大幅上涨”的能力感到有些担忧,但他对Blackwell芯片的生产以及Nvidia较旧的Hopper芯片系列可以填补一切假设空白的潜力充满信心。
“此外,这种情况将对毛利率产生积极影响,因为该公司表示,相对不太成熟的Blackwell供应链将在短期内导致利润率下滑,”Buchalter在谈到Hopper的持续发展势头时写道。
事实上,从Elon Musk最新的动作看来,GPU也似乎势不可挡。
据报道,Elon Musk和xAI背后的团队创造了一项工程奇迹,他们在短短19天内就搭建了一个由100000个H200 Blackwell GPU组成的超级集群。Nvidia首席执行官黄仁勋在X上向特斯拉车主硅谷成员讲述了Elon Musk令人难以置信的安装能力。
黄仁勋对Elon Musk 19天的冒险历程充满敬畏和敬意,称其为“超人”的努力。据称,xAI团队在不到三周的时间内就从“概念”阶段发展到与Nvidia“设备”完全兼容。这还包括在新建的超级集群上运行xAI的首次AI训练。
一般而言,整个过程涉及建造巨大的X工厂,GPU将存放在那里,并为整个工厂配备液体冷却和电源,以使所有200 000个GPU正常运行。更不用说Nvidia和Elon Musk的工程团队之间的所有协调,以便以精确和协调的方式运送和安装所有硬件和基础设施。
不过黄仁勋表示,普通数据中心需要四年的时间才能完成Elon Musk及其团队在19天内完成的工作。其中三年的时间用于规划,最后一年用于运送设备、安装设备并使其正常运行。
二、黄仁勋眼里的公司护城河
英伟达之所以能一往无前,这与公司在GPU方面打造的护城河有着重要的关系。
我们也看到,NVIDIA在过去十多年来一直在软件方面进行投资,使其硬件性能超越普通硅片。这种优异的表现源于不断更新的软件优化和加速库。展望未来,与其图形处理单元相关的无形资产以及专有软件所涉及的转换成本应继续成为推动力。
市场专家认为,就像iOS一样,开发人员正在为iPhone开发应用程序,由此将客户锁定在iPhone上,NVIDIA也在做同样的事情。AI工程师一直在学习使用CUDA平台来编程GPU。这应该有助于固定用户群体。NVIDIA预计会进一步增长,预计2024年第三季度的收入将达到325亿美元。该公司预计其Hopper架构和Blackwell产品将继续扩展。
罗森布拉特证券分析师汉斯·莫斯曼(Hans Mosesmann)也表示:“英伟达的竞争优势非常强大,因为过去15年来,他们一直在投资软件,通过不断更新的软件优化和加速库,使他们的硬件性能优于普通硅片。”“他们比其他所有人都有这个优势。”
CFRA Research分析师Angelo Zino直言,该公司的竞争优势主要在软件方面。
首先是Nvidia专有的CUDA软件,用于加速GPU计算。CUDA平台包括编译器、库和开发人员工具,可帮助程序员加速其应用程序。全球有超过500万开发人员使用CUDA。
根据英伟达首席执行官黄仁勋的评论,Nvidia在人工智能处理器方面的竞争优势是可持续的,包括人工智能推理领域。这对Nvidia来说是个好兆头。
Melius Research分析师Ben Reitzes在周一的一份客户报告中表示,Nvidia首席执行官黄仁勋(Jensen Huang)最近在BG2播客上谈到了公司的竞争定位,因此,他对Nvidia的前景更加有信心。
Nvidia的怀疑者表示,与训练相比,该公司在AI推理方面没有竞争优势。他们表示,定制专用集成电路将主导该市场。
但黄仁勋表示,得益于该公司的Cuda软件和NVLink网络,Nvidia在推理领域的“护城河将会更大”。
此外,Reitzes表示,Nvidia也在不断改进其算法并确保其旧芯片能够与新应用程序兼容。
他还表示,Nvidia在制造完整的AI数据中心系统方面远远领先于竞争对手。
黄仁勋表示,信息技术市场在升级系统以支持人工智能方面才刚刚进入“第二阶段”。他说,到目前为止,该市场已经花费了大约1500亿美元,而升级“旧IT基础设施”所需的资金为1万亿美元。
“他似乎不仅关心股东,而且他的话也比任何人都好,”雷茨写道。“严肃地说,这表明他对远远领先于竞争对手的战略充满信心——没有什么可隐瞒的。”
“然而,真正的原因是基于Nvidia的系统可以最大化投资回报,因为Nvidia不断地改进其算法并进行集成,以使其旧芯片与新芯片兼容,”Reitzes写道。他在一份研究报告中写道:“Nvidia最大的成就是创建了一个可以在所有大型云到最小云上运行的基础设施,并且能够以最快的速度实现盈利。”
Reitzes表示,Nvidia是一家生产力极高的公司,其利润规模应该会继续让投资者感到高兴,这可能会推动其股价创下新高。Reitzes指出,Nvidia报告称,Nvidia的人均收入为410万美元,而苹果为230万美元,Meta Platforms为240万美元。
护城河讨论可能会让那些担心Nvidia在推理领域不再拥有与训练市场同等优势的投资者感到放心。
三、GPU,泡沫将破?
虽然英伟达还是在高歌猛进,但在latent.space的作者Eugene Cheah看来,GPU的泡沫破裂风险大增。
据他在一篇分析文章建言——不要购买H100,这是因为他看到由于预留计算转售、开放模型微调和新基础模型公司的衰落,市场已从短缺(8美元/小时)转变为供过于求(2美元/小时)。对于一般市场而言,由于目前供应过剩,用户可以在需要时以接近成本的价格租用H100。
因此现在投资购买新的H100意义不大。
他表示,ChatGPT引爆的生成式AI热潮,让市场对GPU的需求暴增。于是,英伟达推出了性能更强的H100。如他所说,与A100相比,新款H100的功能强大3倍,但标价仅为2倍。而随着需求的增加,H100市场价格正在一路飙升。
据透露,H100最初的租金约为每小时4.70美元,但涨幅超过8美元。所有绝望的创始人都急于训练他们的模型,以说服投资者进行下一轮1亿美元的融资。这也是一笔很可靠的交易。于是,在2023年的大部分时间里,H100每小时的租赁价格似乎会永远高于4.70美元(除非你愿意预付一大笔首付)。
但随后,随着竞争的加剧,GPU的租用价格将一路下降。
Eugene Cheah透露,2024年8月,如果有人愿意拍卖一小段H100的使用时间(几天到几周),就有人可以开始以每小时1到2美元的价格找到H100 GPU。
Eugene Cheah预计,GPU的租用价格每年会下降≥40%,尤其是小型集群。NVIDIA的市场预测是4年内,GPU每小时的租赁价格会下降到4美元,但不到1.5年就会蒸发殆尽。这很可怕,因为这意味着有人可能会承担责任——尤其是如果他们只是购买了新GPU。
根据他在文章中计算所得,如果价格跌破1.65美元/小时,那么基础设施提供商注定会在5年内在H100上亏损。特别是如果有商家今年才购买节点和集群的话。
在他看来,这种急剧下滑的趋势主要由三种原因造成:
1. 大型模型创建者脱离公有云平台
一个主要因素是,所有主要的模型创建者,例如Facebook、X.AI以及OpenAI(如果将它们算作微软的一部分)正在脱离现有的公共提供商,并构建自己的价值数十亿美元的集群,从而消除了对现有集群的需求。
2. 未使用/延迟供应上线
还记得2023年时或6个月或更长时间的所有H100大型出货延迟吗?它们现在正在上线——与H200、B200等一起。
与此同时,各种此前未使用的供应商也上线了(来自前面提到的现有初创公司、企业或风险投资公司)。
3. 更便宜的GPU替代品(尤其是用于推理)
另一个主要因素是,一旦你超出了训练/微调空间,就会有很多替代方案,尤其当你运行的是较小的模型。
人们不需要为H100的Infiniband和/或nvidia支付额外费用。
基于这些分析,Eugene Cheah建议人们不要购买全新的H100。
四、写在最后
分析人士表示,虽然Nvidia目前最畅销的产品之一是其H100图形处理单元(GPU)。Meta Platforms首席执行官马克·扎克伯格和特斯拉首席执行官埃隆·马斯克都特别提到了H100技术对各自业务的生成式AI开发的重要性。
然而,尽管H100的需求持续旺盛,但Nvidia已经即将推出后续芯片组。该公司的新款Blackwell GPU定于今年晚些时候推出,华尔街和Nvidia自己的管理层都预测到今年年底销售额将增加数十亿美元。
此外,Meta、特斯拉、微软、亚马逊和Alphabet等公司继续大力投入资本支出(capex),这应该会为Nvidia的计算和网络业务带来良好的推动力。
考虑到这些,一旦Blackwell真正取得成功,Nvidia的股价可能在未来几年内进一步上涨。
而为了巩固自己的地位,英伟达在过去一段时间里不断收购,以加深护城河,截至目前,Nvidia已在2024年进行了四次收购。今年4月,Nvidia同意收购以色列公司Run.ai,据报道,交易价值约为7亿美元。Run.ai是ClearML的竞争对手。
Nvidia还投资了许多初创企业和科技公司,包括Arm Holdings(ARM)、Soundhound AI(SOUN)和Serve Robotics。
Enderle Group的总裁兼首席分析师Rob Enderle也直言,在他与HP和IBM等多家厂商交流以后得出结论:他们的AI服务战略都严重依赖Nvidia。
但是,反垄断担忧也在威胁着英伟达,所以,大家对GPU巨头的未来怎么看呢?
参考链接:
https://www.reuters.com/technology/nvidia-rallies-poised-dethrone-apple-most-valuable-company-2024-10-14/
https://www.datacenterdynamics.com/en/news/nvidias-blackwell-gpus-sold-out-for-12-months/
https://www.marketwatch.com/amp/story/nvidias-stock-heads-for-first-record-high-in-months-as-customers-seem-locked-in-e24c22bf
https://www.latent.space/p/gpu-bubble