扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
英伟达Computex发布带原生CUDA的RTX Spark笔记本、支持本地万亿参数推理的DGX Station桌面机,通过新增算力收费口扩张市场,改变全球AI产业格局。 ## 1. CUDA进笔记本,打破高通ARM的叙事缺口 英伟达三十年真正的AI护城河是CUDA,全球750万开发者依托它开发,主流AI框架的最优路径全在这里,二十年建成无对手可复制。 此前CUDA仅局限于数据中心,全新RTX Spark笔记本将CUDA带入便携设备,搭载20核ARM CPU+Blackwell GPU的6144个CUDA核、128GB统一内存,AI算力达1 PetaFLOP,机身仅14毫米厚,已获得100家Windows软件商原生支持,数据中心开发者无需修改代码即可使用。 高通Snapdragon X已拿下美国800美元以上Windows笔记本10%的份额,有80多个OEM设计,今年上半年推出的X2 Elite NPU算力达80 TOPS,先发优势明确,但因缺少CUDA支持,在AI开发者阵营永远只能是备选项。 ## 2. 桌面推理DGX Station,开辟企业端第二收费口 DGX Station for Windows基于GB300 Grace Blackwell Ultra芯片,可本地最高跑1万亿参数模型,支撑数百个AI agent并行,定价8万-12.5万美元,Q4上市由华硕、戴尔等企业级渠道主力厂商出货。 目标客户为推理需求稳定、数据敏感的企业:金融风控、律所阅合同、医疗影像分析这类密集 workload,用云实例计费4-6个月即可回本DGX Station的采购成本,且满足“数据不出本地”的合规硬性要求,这类客户几乎别无选择。 对英伟达而言,这是在云厂商数据中心GPU之外,新开的第二个企业算力收费口,两份收入均计入英伟达营收。 ## 3. 云厂商的竞合变局:议价空间被压缩,结构性矛盾浮现 英伟达是云厂商最大的硬件供应商,DGX Station和云数据中心GPU扩容不冲突,AI推理市场年增速超40%,总盘子足够容纳本地化与云端同时增长。 真正改变的是云厂商的议价空间:原本只能上云的场景多了本地选项,企业采购可拿DGX Station报价压云服务价格,压缩了云厂商的价格弹性。 AWS、Google早已自研推理芯片减少对英伟达依赖,DGX Station让局面更复杂:云厂商既要向英伟达买GPU,又要和英伟达自家桌面硬件竞争推理业务,双方会从纯供应商关系逐步转向复杂竞合。 微软处境最特殊:它是RTX Spark最核心合作方,和英伟达共同改造Windows为AI agent操作系统,但Azure又是全球头部AI云服务,需要和合作伙伴的桌面硬件竞争部分推理负载,矛盾短期不会爆发但值得观察。 ## 4. 对标苹果M系列:短期撬动开发者,长期考验生态粘性 业界解读RTX Spark直指苹果M5,但实际苹果的核心护城河不是芯片性能,而是积累十几年的macOS创意工作流,Final Cut Pro、Logic Pro等独占软件很难被一块更快GPU替换。 英伟达已经推动Adobe重构Photoshop、Premiere Pro支持RTX Spark,但从软件重构到用户迁移需要漫长的习惯替换过程,短期仅能撬动原本就在Windows/Linux用CUDA的AI/ML开发者,不会大规模抢苹果用户,苹果真正需要警惕的是2028年Rubin Spark成熟后的竞争。 ## 5. 英伟达藏的内部考题:集成GPU分流独显营收 英伟达未主动宣传的信息是:RTX Spark集成GPU性能对标RTX 5070,若产品成熟,高端笔记本买家可能不再需要额外独立显卡,英伟达只是换一种形式收这笔钱。 英伟达游戏业务2026财年预计营收160亿美元,同比增长41%,当前独显仍有功耗和绝对性能优势,但参考苹果M1推出后三年内Intel独显MacBook彻底下架的先例,英伟达主动选择这条路,赌AI PC增量足够填上独显收缩的坑,实际代价会比发布会展示的更高。 ## 6. 后市观察节点与资产判断 秋季是验证窗口,核心要看两个数据:OEM定价(预期1400美元起,超过1800美元需求会滑坡)和Windows ARM兼容性(若走高通的发展轨迹,需要12-18个月成熟)。 中期要关注高通X2 Elite的跑分、DGX Station首批企业客户公告,若云厂商主动下调推理定价应对DGX Station,说明竞争压力已经坐实,定价逻辑重估会提前到来。 资产层面:NVDA是主线,收费口从1个扩为3个,TAM扩张,秋季OEM定价是近期分水岭;QCOM承受直接AI开发者叙事压力,但消费端有韧性,X2 Elite窗口内有反弹空间;云厂商短期不受影响,中期承压的是议价权而非营收体量;MSFT双面下注,净效应看推理规模化速度;ARM和联发科是确定性受益的小标的。
2026-06-01 18:04

黄仁勋的“新阳谋”:条条大路通算力,每条都有英伟达收费口

本文来自微信公众号: 华尔街见闻 ,作者:研外之意Pro


黄仁勋今天在中国台北做了两件事:把CUDA塞进了笔记本,把万亿参数推理搬到了桌边。


这不是英伟达在和云厂商抢生意。AWS、Azure、Google Cloud是英伟达最大的几个客户,每年向它采购数百亿美元的GPU。


英伟达不会跟自己的金主动刀,真正发生的事是:英伟达在扩张收费口。


以前AI算力只有一条路——买英伟达的GPU放进云厂商的数据中心。


现在多了两条:RTX Spark笔记本,DGX Station桌面机。


无论你选哪条,英伟达都在路口等着。


黄仁勋管自己叫"基础设施公司",这句话的意思是:AI跑在哪里不重要,重要的是英伟达铺了路。


CUDA第一次进了背包


英伟达三十年真正的护城河不是GPU,是CUDA。


750万开发者在上面工作,PyTorch、TensorRT、TensorRT-LLM、llama.cpp,主流AI框架的最优路径全在这里。二十年建成,没有任何一家公司复制过。


麻烦是CUDA一直被关在数据中心里。云端写的代码带不进轻薄本,高通Snapdragon X做了很多,就是没有CUDA,苹果M系列是另一个世界。


RTX Spark拆掉了这道墙。20核ARM CPU加Blackwell GPU的6144个CUDA核,128GB统一内存,AI算力1 PetaFLOP,塞进14毫米厚的笔记本。


英伟达已与100家Windows软件商谈妥,TensorRT、PyTorch CUDA后端、TensorRT-LLM原生支持。


在数据中心写了三年CUDA的工程师,拿起RTX Spark笔记本,理论上不需要改一行代码。



高通碰上的麻烦不是算力输了,是叙事失守了。Snapdragon X花三年把Windows on ARM的口碑做起来,能效比终于接近苹果——唯一没拿下的是AI开发者。那批人一直站在场外,等一台能跑CUDA的Windows笔记本。


英伟达带着CUDA来了,他们等到了。


Snapdragon X不是没有筹码。美国800美元以上Windows笔记本市场它占了10%,80多个OEM设计在跑,X2 Elite今年上半年发布,NPU直奔80 TOPS,先发优势是真实的。


但没有CUDA,高通在AI开发者那里永远只能是备选项。


桌边开了第二个收费口


另一个产品的逻辑完全不同,目标客户也不一样。


DGX Station for Windows基于GB300 Grace Blackwell Ultra芯片,本地跑最高1万亿参数模型,支撑数百个AI agent并行,定价8万到12.5万美元,Q4上市,华硕、戴尔、技嘉、惠普、MSI、超微出货。


这台机器的买家不是个人消费者,是那些AI推理需求足够稳定、数据足够敏感、不想每个月给云厂商开大额账单的企业。


金融机构的风控模型、律所的合同审阅、医疗机构的影像分析——这类工作负载每天密集运行,用云端B300专用实例按小时计费,10万美元的桌面机4到6个月就能回本,之后全是节省。


注意英伟达选的OEM合作方:华硕、戴尔、惠普、超微,全是企业级渠道的主力,不是消费品牌。目标客户写在配置清单里。


DGX Station还有一个隐性优势是纯粹的数据合规。云端推理意味着数据要出本地网络,金融监管对客户数据的跨境流动越来越严,医疗数据的隐私规范也在收紧。对这类企业,"数据不出门"不是锦上添花,是硬性要求。他们不是因为算便宜才买DGX Station,是因为别无选择。


这是英伟达在企业算力市场开的第二个收费口——第一个是云厂商数据中心里的GPU,第二个是企业自己桌边的GPU。两个口都是英伟达的货,两笔钱都进英伟达的账。


云厂商的处境,不是"被抢",是"被多了一个选项"


英伟达是云厂商最大的硬件供应商,双方不是竞争关系。


DGX Station卖出一台,英伟达收一笔硬件钱;云厂商的数据中心扩容,英伟达收更多GPU款。


两件事可以同时发生,而且大概率会同时发生——AI推理市场每年40%以上的速度在增长,总盘子够大,容得下本地化和云端同时膨胀。


真正受影响的,是那些原本"只能上云"的场景开始有了本地选项。对云厂商来说,这压缩的不是营收规模,而是议价空间——当企业采购负责人拿着DGX Station的报价坐到谈判桌上,云厂商的价格弹性就没有以前那么足了。


AWS和Google这两年也在押注自己的推理芯片——AWS Trainium、Google TPU——部分原因正是为了减少对英伟达的依赖。DGX Station的出现进一步复杂化了这个局面:云厂商既要向英伟达采购GPU,又要在推理层面跟英伟达自家的桌面硬件竞争。


这个结构性矛盾不会在一两个季度内爆发,但随着本地推理规模的扩大,云厂商和英伟达之间从纯粹的供应商关系,会慢慢走向更复杂的竞合。


微软夹在中间最难受。它是RTX Spark最核心的合作方,和英伟达一起把Windows改造成AI agent操作系统,Surface Laptop Ultra是第一台RTX Spark笔记本,两家站在一条战线上。


但微软的Azure是全球最大AI云服务之一,现在需要跟合作伙伴自家的桌面机去竞争部分推理工作负载。这个矛盾短期不会撕裂,但值得看它怎么演。


苹果的护城河,比RTX Spark更深


RTX Spark发布时苹果被直接点名,媒体几乎一致的解读是:冲着M5来的。


不全对。苹果的护城河不在芯片性能。M5 Max内存带宽153GB/s,跑超过24GB参数量的大模型有架构优势,但更深的壁不在这里——Final Cut Pro没有Windows版,Logic Pro没有Windows版,创意工作流在macOS上积了十几年,一块更快的GPU换不动它。


Adobe宣布重构Photoshop和Premiere Pro支持RTX Spark,是英伟达在创意侧最重的一手牌,但软件重构到用户真正迁移,中间有漫长的习惯替换。


英伟达短期能从苹果身上撬动的,只有AI/ML开发者——这批人本来就在Windows和Linux上用CUDA,RTX Spark给了他们一台更便携的机器,不是从苹果手里抢人。苹果真正需要认真对待的版本是2028年Rubin Spark成熟之后,不是今天秋天。


英伟达自己藏着的那道题


规格表里有一行英伟达没有大声说:RTX Spark集成GPU性能对标RTX 5070。


英伟达靠独显赚了三十年钱,Gaming FY2026全年160亿美元,同比增长41%。


如果RTX Spark真到了RTX 5070的性能水平,高端笔记本买家以后可能不再需要一张独立显卡——那张"显卡"被整合进SoC了,英伟达还是在收那笔钱,只是换了形式。


短期独显仍有功耗和绝对性能的上限优势。但苹果2020年推M1时所有人都说独显不会死,三年后搭Intel独显的MacBook从货架上消失了。


英伟达在主动选这条路,赌AI PC带来的增量市场足够大,能填上独显收缩的坑。


不一定错,但代价比发布会上看起来的高。


该盯什么


秋季是真正的验证窗口。第一批RTX Spark笔记本的价格上架,开发者在真实设备上跑起CUDA,故事才会从Computex舞台走进财报。


最重要的两个数字:OEM定价和Windows ARM兼容性测试结果。定价预期1400美元起,超过1800美元需求预期就会滑坡;兼容性如果走高通入场时的轨迹,还要12到18个月才能成熟,这段时间高通的市场积累不会停着等。


中期看高通X2 Elite的跑分数据和DGX Station的首批企业客户公告——前者告诉你高通的反击力度,后者告诉你企业本地化推理的真实需求规模。若云厂商开始主动下调推理定价来应对DGX Station,那说明竞争压力已被内部确认,定价逻辑的重新评估会来得更早。


资产上,NVDA是主线,收费口从一个变成三个,TAM在扩张,秋季OEM定价是近期分水岭。QCOM是最直接的压力标的,AI开发者叙事受损,但消费端有韧性,X2 Elite窗口内有反弹空间。云厂商短期不受影响,中期承压的是议价权而非营收体量,两件事不是一回事。MSFT双面下注,净效应看推理规模化速度。ARM和联发科是确定性受益的小标的。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: