扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
NVIDIA CEO黄仁勋在与Lex Fridman的深度对话中,揭示了AI已进入AGI时代,断言中国AI创新速度全球第一,并预言全球程序员将从3000万暴增至10亿。他分享了英伟达从濒临破产到定义AI计算范式的生死博弈,并勾勒出以“极致协同设计”为核心的万亿商业未来。 ## 1. 极致协同设计:从芯片到AI工厂的范式革命 - 黄仁勋指出,传统“单体芯片”思维已过时,计算的基本单位已从GPU转变为吉瓦级的“AI工厂”。 - 解决分布式计算中的延迟、网络和电源问题,其复杂程度不亚于设计芯片本身,必须对整个技术栈进行垂直整合。 ## 2. CUDA的生死豪赌:装机量是终极护城河 - 为普及CUDA架构,英伟达毛利率曾严重受压,市值一度跌至15亿美元,这是一场关乎存亡的战略决策。 - **装机量决定架构地位**,架构的优雅性在装机量面前退居二线,CUDA的成功本质是生态规模的胜利。 ## 3. 尺度定律的进阶:AI代理是Token时代的“iPhone时刻” - AI演进正经历预训练、后训练、推理时计算和“代理扩展”四个阶段,代理扩展将是下一个爆发点。 - AI正从简单的文件检索转向实时、自主的生成式思维,智能体(Agents)的崛起标志着生成式计算新纪元的开启。 ## 4. 能源瓶颈与供应链:极致工程破解算力规模化难题 - 面对能源瓶颈,英伟达通过“极致协同设计”将每瓦特产生的Token数量提升几个数量级,持续降低Token成本。 - 黄仁勋亲自协调全球供应链,与TSMC等伙伴基于三十年信任合作,涉及百亿美元业务甚至无需正式合同。 ## 5. 领导力哲学:“光速”原则与战略性遗忘 - 黄仁勋的管理核心是“光速”原则,即强迫团队思考第一性原理,对照物理极限来优化一切,而非追求百分比改进。 - 他推崇“战略性遗忘”和承受苦难的能力,认为“如果早知道创业如此艰难,可能就不会去做了”,保持童心和无知是一种超能力。 ## 6. 中国生态与开源未来:建设者国家的创新速度 - **中国拥有全球约50%的优秀AI研究人员**,其内部竞争文化和校友网络导致“隐性开源”,创新速度世界第一。 - 英伟达开源Nemotron等模型,旨在让AI普及到每个行业和国家,开源是AI革命的根本必要条件。 ## 7. AGI已来临与职业重塑:智能商品化,人性是力量 - **黄仁勋断言:“我认为我们现在就已经实现了AGI。”** 并以OpenClaw为例,说明AI运营十亿美元公司已成为可能。 - 全球能编程的人将从3000万暴增至10亿,当智能成为廉价商品,人类的核心竞争力将回归品格、同理心和愿景。 ## 8. 未来愿景:太空计算与意识永生 - 英伟达GPU已进入太空,未来将探索在太空中进行计算以解决能源问题,并实现“平滑降级”的智能电网利用。 - 黄仁勋希望在工作中瞬间离世,然后将自己的意识转化为AI,以光速射向宇宙,展现出终极的浪漫情怀。
2026-03-24 13:39

黄仁勋最新Lex3万字神级访谈:断言中国AI 进化速度世界第一,AGI已经来临,全球程序员将暴增至10亿,揭秘英伟达万亿商业版图

本文来自微信公众号: Web3天空之城 ,作者:Web3天空之城,原文标题:《黄仁勋最新 Lex 3万字神级访谈:断言中国 AI 进化速度世界第一,AGI已经来临,全球程序员将暴增至10 亿,揭秘英伟达万亿商业版图》


城主说|就在刚刚,NVIDIA CEO黄仁勋与知名播客Lex Fridman进行了一场堪称“神级”的马拉松式深度对谈。


在这篇对谈中,63岁的黄仁勋罕见地毫无保留。他复盘了NVIDIA险些破产的CUDA生死局,深度点评了马斯克(Elon Musk)近乎疯狂的“光速工程学”,对当下所有人最关心的命题抛出了一个个颠覆认知的断言:


  • •关于AGI:“我认为我们现在就已经实现了AGI。”


  • •关于中国AI:“中国是当今世界上创新速度最快的国家,他们本质上在进行隐性开源。”


  • •关于未来职业:“智商即将成为廉价商品。全球能编程的人将从3000万暴增到10亿,未来决定你上限的是品格和对苦难的承受力。”


  • •关于生死:“我不相信继任计划,我希望在工作中瞬间离世。然后把我的意识化作AI,以光速射向宇宙。”


这是一个信息密度极高、商业洞察极深又充满着终极浪漫的深度访谈,以下为本次访谈的重点划线内容和详细图解,最后是无删减精翻完整版,建议找一个安静的时间,仔细研读。


视频全文:


00:00:00极致协同设计与英伟达的组织管理哲学


00:10:43计算平台架构的战略抉择:构建全球人工智能生态


00:22:46四大尺度定律与智能代理系统的崛起


00:37:47算力规模化的挑战:能源效率与供应链整合


00:53:15系统工程学:高效建设与“光速”物理极限


01:01:27技术创新生态:工程文化、开源力量与台积电的成功


01:15:15从图形处理器到行星级人工智能工厂:核心护城河


01:30:10令牌经济学:智能作为商品的商业未来


01:41:30人工智能时代的职业重塑、工程韧性与管理智慧


01:55:31通用人工智能的本质:赋能人类文明的未来


核心观点


  • •极致协同设计:为了超越摩尔定律的局限,必须对从芯片、网络到机架和软件的整个技术栈进行垂直整合。


  • •装机量是终极护城河:架构的优雅与否在装机量面前退居二线,CUDA的成功本质上是生态规模的胜利。


  • •Token时代的“iPhone时刻”:AI代理(Agents)的崛起标志着AI正在从简单的文件检索转向实时、自主的生成式思维。


  • •“光速”原则:不满足于百分比的改进,而是直接对比物理极限,将复杂工程问题简化并推向极致。


  • •智能是商品,人性是力量:当智能变得廉价且普及,人类核心竞争力将回归于品格、同理心和解决问题的愿景。



极致协同设计:当计算单元变为“AI工厂”


面对当代人工智能对算力的贪婪需求,黄仁勋认为传统的“单体芯片”思维已经彻底过时。他提出了“极致协同设计(Extreme Co-design)”的概念,这不仅是工程上的挑战,更是对计算机定义的重构。


“之所以必须进行极致协同设计,是因为问题的规模已经超出了单台计算机的能力,”黄仁勋指出。“当你增加10000台计算机,你希望它能快上一百万倍,而非仅仅是线性增长。”在他看来,解决分布式计算中的延迟、网络、交换机和电源问题,其复杂程度不亚于设计芯片本身。NVIDIA的工作重心已经从制造显卡转向了构建整个数据中心。


他强调,NVIDIA的思维模型已经从单颗芯片进阶到了吉瓦级(Gigawatt)的集群。“今天,我不再拿起一颗芯片向大家展示,那太‘可爱’了。我的思维模型是这个巨大的、连接着电网、拥有精密冷却系统的AI工厂。”这种转变意味着,计算的基本单位不再是GPU,而是整个基础设施。


CUDA的生存豪赌:装机量决定生死



回顾NVIDIA的发展史,CUDA的诞生无疑是最具胆识的战略决策。当时,为了在每一台GeForce GPU中植入CUDA架构,NVIDIA的毛利率遭受了严重挤压,市值一度跌至15亿美元。


“那是一个关乎存亡的时刻,”黄仁勋回忆道。“装机量(Installed Base)就是一个架构中最重要的部分。架构本身可能会招致批评,但装机量决定了架构的地位。”他之所以坚持在消费级GPU上普及CUDA,是为了吸引开发者。开发者不会选择最“优雅”的架构,而是会选择受众最广的平台。


通过在大学开展教育、编写教材,NVIDIA在十年间默默培育了一个无人能敌的生态系统。“我们增加了一半的成本,却没有任何玩家理解或愿意为此买单。但这正是我们所坚信的事业:将超级计算机带给每一位研究人员。”这种对“生态优先”的坚持,最终让NVIDIA在深度学习爆发时,成为了全球唯一的入场券持有者。


算力规模定律的进阶:从预训练到AI代理


黄仁勋一直是规模定律(Scaling Laws)的坚定信奉者。他认为,AI的演进正经历四个阶段:预训练、后训练、推理时计算以及正在发生的“代理扩展(Agent Scaling)”。


他预言,AI代理的崛起将是Token时代的“iPhone时刻”。“下一个扩展定律是代理扩展。通过AI乘数,我们可以随心所欲地衍生出各种子代理,这就像是组建大型团队。”他以OpenClaw为例,指出AI正在从简单的对话系统转向具备自主研究、工具调用和多步规划能力的数字员工。


对于业界担心的能源瓶颈,黄仁勋展现了务实的一面。他提出通过“极致工程”将每瓦特产生的Token数量提升几个数量级,并建议建立“平滑降级”的数据中心,利用电网的闲置富余电力。“智能的发展将由算力这一单一因素驱动。只要它遵循物理定律,就没有什么是无法解决的。”


领导力哲学:“这能有多难?”


作为全球最长任期的科技公司CEO,黄仁勋的管理风格独树一帜。他管理着60名直属下属,且从不进行一对一谈话,而是倡导所有人在公开会议中共同进行逻辑推演。


他最著名的原则是“光速(Speed of Light)”。在他眼中,光速是指物理学所能达到的极限。“我不喜欢所谓的持续改进,我强迫每个人思考第一性原理。如果从零开始,完全受限于物理限制,这件事最快需要多久?”这种思维让他能将需要74天完成的任务,通过逻辑重构缩短至6天。


面对压力和挫折,黄仁勋推崇一种“战略性遗忘”和“承受苦难”的能力。“如果你早知道创业会有多艰难,你可能就不会去做了。所以,保持童心和某种程度的无知是一种超能力。你会对自己说:这能有多难?”正是这种对未来愿景的浪漫主义情怀,支撑着他在无数次濒临倒闭的尴尬中重新站起来。


全球生态与信任:没有合同的百亿生意


在谈到全球科技生态时,黄仁勋对TSMC(台积电)和中国科技产业表现出了极高的尊重。他认为,TSMC最大的资产不是某种晶体管技术,而是“信任”。“我们与台积电合作了三十年,涉及数百亿美元的业务,但我们之间甚至没有正式合同。这种信任是基于长期的共同愿景建立的。”


对于中国市场,他将其形容为“建设者国家”。“中国拥有全球约50%的优秀AI研究人员。他们的创新速度极快,且天然倾向于开源合作。这种校友般的互助文化加速了技术的流动。”黄仁勋坚信,开源是AI普及到每一个行业、每一个国家的根本必要条件,这也是NVIDIA积极发布Nemotron等开源模型的原因。


智能商品化:人性是最后的防线



当被问及AI是否会取代人类职业时,黄仁勋给出了乐观的答案。他以放射科医生为例:虽然AI的图像诊断能力早已超越人类,但全球放射科医生的需求量反而增加了。


“软件工程师的目标是解决问题,而不是写代码。我不关心他们写了多少行代码,我关心的是问题的解决。”他认为,未来的每一位木匠、会计师、药剂师都会因为AI的辅助而变成更高级的建筑师或分析师。“编程的门槛将从3000万人扩展到10亿人,因为人类的意图本身就是代码。”


在访谈的最后,黄仁勋对“智能”进行了祛魅。他认为,智能最终会成为一种像水、电、空气一样的廉价商品。“我身边环绕着无数比我聪明的人。智能是一种功能,但人性不是。品格、同理心、决心和愿景,这些才是真正属于人类的力量。”
















天空之城全文整理版


极致协同设计的挑战与分布式计算


Lex:以下是与NVIDIA首席执行官Jensen Huang的对话,NVIDIA是人类文明史上最重要且最具影响力的公司之一。NVIDIA是驱动人工智能革命的引擎,其巨大的成功在很大程度上直接归功于Jensen作为领导者、工程师和创新者所展现的坚定意志,以及他多次卓越的战略博弈与决策。


这里是Lex Fridman Podcast,各位亲爱的朋友们。有请Jensen Huang。你将NVIDIA推向了人工智能的新时代,不仅专注于芯片级设计,如今更拓展到了机架级(Rack-scale)设计。我认为可以公平地说,NVIDIA长期以来的制胜之道在于打造尽可能最优秀的GPU。而你们依然在坚持这一点。但现在,你扩展了这种极致的协同设计,涵盖了GPU、CPU、DPU、内存、网络、存储、电源、散热、软件、机架本身、你们所发布的Pod,甚至是整个数据中心。那么,让我们来谈谈极致协同设计。协同设计一个拥有如此多复杂组件和设计变量的系统,最困难的部分是什么?


黄仁勋:感谢你提出这个问题。首先,之所以必须进行极致的协同设计(Extreme Co-design),是因为问题规模已经超出了单台计算机的能力,无法仅靠单个GPU来加速。你想要解决的问题是,希望运行速度的提升幅度能够超过你所增加的计算机数量。也就是说,你增加了10000台计算机,但你希望它能快上一百万倍。


那么突然之间,你就必须处理算法,你必须拆解算法,必须重构它,必须对流水线进行分片,必须对数据进行分片,还必须对模型进行分片。现在突然之间,当你以这种方式分发问题时——不仅仅是扩展问题规模,而是分发问题——那么一切都会成为阻碍。


这就是阿姆达尔定律(Amdahl's law)所面临的问题,即你能获得的加速程度取决于该部分占总工作量的比例。因此,如果计算任务占整个问题的50%,即使我将计算速度提升至无限快,比如快上一百万倍,整个工作负载也仅仅加速了两倍。现在突然之间,你不仅要分发计算任务,还必须以某种方式对流水线进行分片,同时还必须解决网络问题,因为你所有的这些计算机都连接在一起。所以,在我们所做的这种规模的分布式计算中,CPU是个问题,GPU是个问题,网络是问题,交换机也是问题。


黄仁勋:以及将工作负载分配到所有这些计算机上也是一个问题,这仅仅是极其复杂的计算机科学问题。因此,我们必须动用一切技术来解决。否则,我们将只能进行线性扩展,或是基于摩尔定律(Moore's Law)的能力进行扩展,而由于登纳德缩放定律(Dennard scaling)的放缓,这一速度已在很大程度上减慢了。


专家团队与组织架构的哲学


Lex:我相信这其中存在权衡。此外,你在此汇集了完全不同的学科。我相信在这些领域中的每一个,都有各自的专家,无论是高带宽内存、网络和NVLink、网卡、你所使用的光电技术、供电、散热,还是冷却,等等。在这些领域中都有世界级的专家。你如何让他们齐聚一堂来共同研究呢?


黄仁勋:这就是为什么我的团队规模如此之大。


Lex:你能跟我讲讲专家和系统设计之间的流程吗?比如,当你确定了一组必须塞进机架的组件时,你是如何把机架组装起来的?是的。那么,将所有这些东西整合在一起的设计过程是怎样的?


黄仁勋:首先是第一个问题,什么是极致协同设计(Extreme Co-design)?意味着,你正在对从架构开始的整个软件堆栈进行优化。包括芯片、系统、系统软件,一直到算法和应用。这是一个层面。


第二点是你我刚才谈到的,即超越了CPU、GPU、网络芯片、向上扩展交换机(Scale-up switches)和向外扩展交换机(Scale-out switches)的范畴。当然,你还必须考虑电源、冷却系统以及所有相关设施,因为所有这些计算机都极其、极其耗电。它们工作量巨大,虽然能效比很高,但总体而言,它们仍然消耗大量的电力。


所以,这就是第一个问题:它究竟是什么?第二个问题是,为什么会这样?我们刚才谈到了原因,你是为了分配工作负载,从而获得超过单纯增加计算机数量所带来的收益。第三个问题是,它是如何实现的?你是如何做到的?


而这,这正是这家公司的奇迹所在。当你设计一台计算机时,你必须、必须、必须拥有计算机的操作系统。当你设计一家公司时,你应该首先考虑你想让这家公司生产什么产品?我见过很多公司的组织架构图,它们看起来都一样。汉堡包公司的组织架构图、软件公司的组织架构图和汽车公司的组织架构图,它们看起来如出一辙。这对我来说毫无意义。一家公司的目标应该是成为产生输出的机器、机制和系统。而那个输出就是我们想要创造的产品。


公司的架构也应当被设计为能够反映其所处的环境。这几乎直接指明了你应该如何管理组织。我的直属员工有60人。我无法与他们进行一对一沟通,因为这根本不可能。如果你想把工作做好,你的直属团队不可能有60个人单线汇报。


Lex:所以你依然有60名下属。不仅如此,确实更多。而且大多数明星员工至少在工程领域都有所涉猎。


黄仁勋:几乎所有人都是如此。这里有内存方面的专家。这里有CPU方面的专家,也有光学方面的专家。还有GPU、架构、算法和设计方面的专家。


Lex:所以你必须时刻关注整个技术栈。而且你们会针对整个技术栈的设计进行激烈的讨论。


黄仁勋:没有任何对话是由单个人独立做出的。这就是我不进行一对一谈话的原因。我们提出一个问题,然后所有人共同攻克它。因为我们正在进行流式协同设计(Streaming Co-design)。而且实际上,公司一直都在进行流式协同设计。


Lex:所以即使你在讨论某个特定的组件,比如散热或网络,大家也都在旁听。没错。他们可以提出意见,比如,这对于配电来说行不通。这对于内存来说行不通。这对这个来说行不通。


黄仁勋:没错。任何想退出的就退出好了。你知道我在说什么吗?是的。原因在于员工们知道,他们知道在什么时候该怎么做,什么时候该给予关注。如果他们本应做出一些贡献,但他们并没有做出贡献,我会公开指责他们。我会说,嘿,别这样。让我们加入进来共同解决。


从游戏GPU到AI工厂的转型


Lex:所以,正如你提到的,NVIDIA是一家正在适应环境的公司。那么在哪个时间点,你可以说环境发生了变化,你开始在早期从用于游戏的GPU,或许到早期的深度学习革命,暗中进行某种适应,以至于现在我们开始将其视为一座AI工厂。NVIDIA是做什么的?它生产AI。让我们建造一座制造AI的工厂。


黄仁勋:我可以,我可以系统地推导这一切。我们起初是一家加速器公司,但加速器的问题在于应用领域过于狭窄。它具有针对特定任务进行深度优化的优势。任何专业领域的产品都具备这种优势。深度专业化的问题在于,你的市场覆盖范围自然会变窄。但这甚至是可以接受的。问题在于市场规模也决定了你的研发能力。而你的研发能力最终决定了你在计算领域可能产生的影响力和影响力深度。


因此,当我们最初以加速器,即某种非常具体的加速器的身份起步时,我们就清楚这只是我们的第一步。我们必须找到一种方法,转型为加速计算领域。


Lex:但问题在于,当你成为一家计算公司时,其通用性太强,这会削弱你的专业化程度。


黄仁勋:我将两个实际上存在根本张力的词联系在了一起。我们成为的计算公司越出色,我们在专业化方面就越逊色。专业化程度越高,我们进行通用计算的能力就越弱。


因此,我特意将这两个词结合在一起,因为公司已经定义了一条非常狭窄的路径。我们要一步一个脚印地去扩大计算的视野,但绝不能放弃我们所拥有的最重要的专业化能力。


好的。我们在加速计算之外迈出的第一步,就是发明了可编程像素着色器(Programmable Pixel Shader)。这是迈向可编程性的第一步。这是我们迈向计算世界的第一段旅程。我们做的第二件事是创造了它,并将FP32引入了我们的着色器中。那一步FP32,即兼容IEEE标准的FP32,是计算领域迈出的巨大一步。这就是为什么所有致力于流处理器以及其他类型数据流处理器的人都发现了我们。他们说,嘿,突然之间,我们或许可以将这些GPU用于极其密集型的计算任务。


Lex:既然它已经符合IEEE标准了。


黄仁勋:我可以把我之前在CPU上编写的软件拿过来,考虑在GPU上运行它们。这促使我们在FP32之上创建了所谓的Cg。正是Cg这条路径,一步步引领我们最终走向了CUDA。


在G80系列GPU上部署CUDA是一个非常艰难的战略决策,因为它耗费了公司巨大的利润,而当时我们根本负担不起。但我们还是这样做了,因为我们想成为一家计算公司。一家计算公司必须拥有自己的计算架构。而计算架构必须在我们构建的所有芯片之间保持兼容。


CUDA的豪赌与装机量的威力


Lex:你能带我了解那个决定吗?所以将CUDA部署在GeForce上是无法负担的。为什么当时还是大胆地选择了那样做?那是我认为第一个几乎关乎存亡的战略决策。对于不了解情况的人,剧透一下,这被证明是一家公司有史以来最令人惊叹的英明决策之一。因此,CUDA最终成为了这个AI基础设施世界中不可思议的计算基础。你只是在铺垫背景。事实证明,那是一个正确的决定。


黄仁勋:事实证明这是一个非常好的决定。我想,事情的经过是这样的。我们发明了名为CUDA的东西,它扩大了我们可以利用加速器来加速的应用程序范围。问题是,我们该如何吸引开发者使用CUDA?因为计算平台的关键就在于开发者。


Lex:开发者不会仅仅因为一个计算平台能执行某些有趣的任务就使用它。


黄仁勋:他们选择一个计算平台,是因为其装机量(Installed Base)足够大。因为和其他人一样,开发者也希望开发出能触达广大受众的软件。因此,装机量实际上是一个架构中最重要的部分。架构可能会招致大量的批评。例如,没有任何架构像x86那样招致过如此多的批评。因为它被认为是一种不够优雅的架构。然而,它却是当今最具决定性的架构。它向你证明了一个事实:许多由世界上最聪明的计算机科学家精心构建、设计极其出色的RISC架构,在很大程度上都失败了。因此,我刚才给你们举了两个例子,其中一个优雅精妙,另一个几乎毫无美感可言。


Lex:尽管如此,x86还是存活了下来。


黄仁勋:装机量就是一切。装机量决定了架构的地位。而非所有其他因素均处于次要地位。当时确实还存在其他架构。CUDA当时问世了。OpenCL当时也在这里。当时还有几种其他的竞争架构。


Lex:但你们做出的正确决定是,认为归根结底,关键在于装机量,以及如何以最好的方式将一种新的计算架构推向世界。


黄仁勋:在那个时间节点上,GeForce已经取得了成功。我们当时每年已经售出数以百万计的GeForce GPU。


Lex:于是你们决定,必须将CUDA预装到每一台GeForce上,并将其植入到每一台个人电脑中,无论客户是否会使用它。


黄仁勋:并将此作为培育我们装机量的起点。与此同时,我们着手吸引开发者,深入大学开展工作、编写教材、开设课程,让CUDA无处不在。最终,人们会发现它的价值,而当时个人电脑是主要的计算载体。那时还没有云端概念,我们可以将超级计算机带给每一位学校研究人员、每一位科学家、每一所工程学院以及每一位在校学生,最终一定会发生令人惊叹的事情。


然而问题在于,CUDA极大地增加了我们作为消费级产品的GPU成本,以至于它几乎消耗了公司所有的毛利润。


Lex:当时那家公司的市值大概,我也不太确定,是80亿美元左右,还是60亿、70亿美元之类的吧?


黄仁勋:在我们推出CUDA之后,我意识到这会增加巨大的成本,但这是我们所坚信的事业。我们的市值一度跌到了大约15亿美元。我们在那个低谷徘徊了一段时间,然后慢慢地挣扎着复苏。但我们一直依托GeForce来支撑CUDA。我常说NVIDIA是由GeForce建立起来的,因为正是GeForce将CUDA带给了每一个人。


Lex:研究人员和科学家们在GeForce上发现了CUDA,因为他们中许多人本身就是游戏玩家,而且很多人平时也会自己组装电脑。


黄仁勋:在大学实验室里,许多人甚至会用个人电脑组件亲自搭建集群。所以,这就是我们起步的方式。


Lex:后来,这成为了深度学习革命的平台与基石。


黄仁勋:那也是一个非常、非常棒的观察,是的。


Lex:关于那个生存抉择的时刻,你还记得吗?当时公司内部在决定孤注一掷时,那些会议是什么样的,讨论又是什么样的?


黄仁勋:嗯,我必须向董事会明确说明。我们想要达成目标。管理团队当时很清楚,我们的毛利率将会受到严重挤压。


Lex:你可以设想这样一种情况:GeForce将不得不承担CUDA的成本负担,但没有玩家会理解这一点,也没有玩家愿意为此买单。


黄仁勋:他们只会支付特定的价格,无论你的成本是多少都无关紧要。因此,我们将成本增加了50%,这消耗了很大一部分利润,而我们当时是一家毛利率为35%的公司。所以,这是一个相当艰难的决定。但你可以预见到,终有一天这会应用于工作站和超级计算机,在这些领域,我们或许能够获取更高的利润率。所以你可以通过逻辑推理来证明自己能够负担得起,但这依然花费了十年时间。


预测未来的逻辑与领导力


Lex:但这更多像是与董事会的沟通博弈,去说服他们,从心理层面来说。因为NVIDIA一直在进行大胆的押注,预见未来,并在某种程度上,特别是现在,定义了未来。所以我几乎是在寻求一种智慧,关于作为一家公司,你是如何做出那些决策,以及如何实现那样的飞跃。


黄仁勋:嗯,首先,我深受强烈的好奇心驱动。在某个节点,会有一个推理系统清晰地让我确信这个结果将会发生,这件事一定会发生。于是我心中对此深信不疑,而当你心中确信时,你也知道那种感觉,你塑造了一个未来,而那个未来是如此令人信服,以至于它不可能不实现。这期间会伴随着许多痛苦。但你必须坚信你所相信的。


Lex:所以你设想了未来。是的。从某种工程学的角度来看,你本质上是将它逆向实现出来了。


黄仁勋:是的。你会去推演如何达成目标。你会去推演它为何必须存在。而且,我推演过,我们所有在这里的人也都推演过。管理团队会对此进行推演,我们所有人也都花了很多时间在进行推演。


接下来的部分可能是一种技能问题,通常在领导层中,领导者会保持沉默,或者在了解某件事后发表某种宣言,然后迎来崭新的一年,不知为何到了年底,明年我们又要制定全新的计划,进行大规模的裁员,进行大规模的组织架构调整,发布新的使命宣言,全新的标识,就是那一套东西。我们从来没有,我从来不会那样做事。当我了解某件事并开始影响我的思考方式时。我会向身边所有的人明确表示,这很有意思。这将会带来改变。这将会产生影响。


我通过一步又一步的逻辑推演来思考问题。通常情况下,我已经拿定了主意,但我会利用一切可能的机会,获取外部信息、新的见解、新的发现、新的工程进展,包括那些启示和新的里程碑。我会抓住这些机会。并且我会利用它们来重塑其他所有人的信仰体系。我确实每天都在这样做。我在董事会中这样做。我在管理团队中这样做。我正在对我的员工这样做。我试图塑造他们的信仰体系,以便当我某天说,嘿,让我们收购Mellanox时,对每个人来说,这完全显而易见,是我们绝对应该做的。


就在我宣布“嘿,伙计们,让我们全力投入Deep Learning”的那一天。让我告诉你们原因。我已经为公司内部的不同组织铺好了砖。每个组织和每个人,许多人可能已经听说过这一切。公司里的大多数人都听过其中的片段。


Lex:在宣布的那一天,大家基本上已经接受了其中的许多部分。在很多方面,我能想象员工们大概会说:“Jensen,你怎么花了这么长时间?”


黄仁勋:事实上,我一直在塑造他们的信仰体系,因此领导力有时看起来就像是在背后引导。但你一直在塑造他们的观念,甚至到了我正式宣布的那一天,大家百分之百表示认同。但这正是你想要的。你想要带动每一个人。否则的话,当你宣布我们要全力以赴投入某件事时,你的管理团队、董事会、员工和客户,他们会感到困惑,不知道这从何而来,觉得这太疯狂了。


Lex:所以,事实上,如果你回顾一下GTC的主题演讲,你其实也在塑造合作伙伴和整个行业的信念体系。


黄仁勋:我自身员工的信念体系也是如此。因此,当我宣布某件事情时,例如,我们刚刚宣布了Grace CPU,虽然我们姗姗来迟,但我已经谈论这些基石整整两年半了。你们回去翻翻看就会发现,天哪,他们已经谈论这个话题两年半了。所以我一直在一步一个脚印地打下基础。因此当这一刻来临时,当你宣布它,每个人都会觉得,怎么花了这么久?


Lex:但这不仅仅是在公司内部,你还在塑造创新的格局,即更广阔的全球格局。就像把那些想法付诸实践,你确实是在实现现实。


黄仁勋:我们不制造电脑。实际上我们也不构建云。事实证明,我们并不是那样,我们是一家计算平台公司。所以没有人能从我们这里直接购买单一最终产品。这就是奇怪的地方。我们进行垂直设计、垂直整合以实现设计和优化,但随后我们会在每一层开放整个平台,以便集成到其他公司的产品、服务、云、超级计算机和OEM计算机中。


所以令人惊叹的是,如果我没有先说服他们,我就无法完成我现在所做的事情。因此,GTC的大部分内容旨在展现一个未来:当我的产品准备好时,让生态系统也做好准备。


尺度定律:从预训练到代理扩展


Lex:是的。你一直以来都是广义尺度定律(Scaling Laws)的信奉者。那么你现在仍然相信吗?我们现在有了更多的尺度定律。我认为你已经概括了其中的四项:预训练、后训练、推理时计算以及智能体扩展。在你思考未来时,无论是遥远的未来还是近期的未来,有哪些障碍是你最担心的,以至于让你彻夜难眠,必须克服才能持续扩展?


黄仁勋:嗯,我们可以回顾一下人们过去认为的障碍是什么。起初,我们是首个提出预训练尺度定律的,人们曾认为——而且确实有理由这么认为——我们拥有的高质量数据量将限制我们所能达到的智能水平,那条尺度定律是一条非常、非常重要的定律。模型规模越大,相应的数据量越多,就能带来更好、更聪明的AI。这就是预训练的过程。


当时Ilya Sutskever等人说,我们的数据快用完了之类的,说预训练已经结束了什么的。整个行业陷入了恐慌,大家都觉得AI走到尽头了。当然,这显然是不真实的。我们将继续扩大用于训练的数据规模。其中很大一部分数据很可能是合成数据(Synthetic Data)。


这也让人们感到困惑,大家没有意识到,或者说已经忘记了,我们用来教学、用来交流信息的绝大多数数据,其实都是“合成”的。它是合成的,因为它并非源于自然。是你创造了它。我在获取并使用它,我对其进行了修改、增强,我重新生成它,其他人消费它。因此,我们现在已经达到这样一个水平:AI能够获取基本事实,对其进行增强、提升,并合成生成海量数据。而训练后期的那部分工作仍在持续扩展。


所以,我们可以使用的人类生成数据量将会越来越少,而我们用于训练模型的数据总量将持续增长。以至于我们不再受数据限制,训练过程现在受限于算力。其原因在于大多数数据都是合成数据。


Lex:接下来的阶段是测试时间(Test-time scaling)。


黄仁勋:我依然记得人们曾对我说,预训练很难,但推理很简单。人们所谈论的都是些巨型系统,认为推理一定很简单。所以推理芯片将会是些小巧的芯片,它们不像NVIDIA的芯片那样复杂又昂贵。他们认为未来推理市场将会是最大的市场,而且它会很容易,我们要将其商品化。


每个人都能制造自己的芯片,而这对我来说一直是不合逻辑的。因为推理就是思考,我认为思考很难,思考远比阅读要难得多。预训练只是记忆和泛化,寻找模式和关系,这只是在进行阅读;而思考则是推理、解决问题、获取未知的体验,并将它们拆解成可以解决的部分,通过第一性原理推理,或者通过探索、搜索以及尝试不同的事物来解决这些问题。而整个后置过程,即推理阶段的测试时扩展(Test-time scaling),其实就是关于思考、推理、规划和搜索,所以它怎么可能计算量轻呢?我们对此完全正确,所以测试时扩展是极其消耗计算资源的。


那么问题来了,既然我们现在处于推理阶段,也处于测试时扩展阶段,那么在此之后又是什么呢?显而易见,我们现在已经创造出了一个具备代理能力(Agentic)的个体。而这个具备代理能力的个体拥有一个我们已经开发出来的大型语言模型。但在测试时,该代理系统会自行去进行研究、检索数据库,并使用各种工具。它所做的最重要的事情之一,就是分支出并衍生出大量的子代理,这意味着我们现在正在组建大型AI团队。通过雇佣更多“数字员工”来扩大规模,比扩大人类能力的规模要容易得多。


因此,下一个扩展定律就是智能体扩展定律(Agentic Scaling)。这有点像AI的乘数效应。通过AI乘数,我们可以随心所欲地快速衍生出各种代理。所以,目前我们总共有四条扩展定律。随着我们对代理系统的使用,它们将会创造出更多的数据,也会创造出大量的经验。其中一部分我们会说,哇,这真是太棒了,我们应该把它记下来。然后该数据集会一路回溯到预训练阶段,我们对其进行记忆和泛化。


Lex:接着我们在后训练阶段对其进行提炼和微调。


黄仁勋:然后我们通过推理时计算进一步增强它,就是在智能体系统中,将其投放到行业应用中。所以这个循环,这个周期,将会持续不断地进行下去。归根结底,智能的发展将由算力这一单一因素来绝对驱动。


预判未来:NVLink 72与智能体硬件


Lex:但其中存在一个棘手的问题,你必须预见并预测到,其中一些组件需要不同类型的硬件才能实现最佳性能。因此,你必须预见到AI创新将走向何方。例如,确保专家具备稀疏性方面的专业知识。在硬件领域,你无法在短短一周内就完成转型。你必须预判未来的发展趋势。


黄仁勋:这听起来既可怕又困难,例如,这些AI模型架构大约每六个月就会更新一次。确实。而系统架构和硬件架构大约每三年更新一次。因此,你需要预判两三年后可能会发生什么。实现这一点有几种方法。首先,我们可以自己在内部进行研究。这也是我们开展基础研究的原因之一。我们创建自己的模型,因此在此拥有切身的实践经验。这就是我所说的协同设计的一部分。我们也是世界上唯一一家与全球每一家AI公司开展合作的计算平台公司。在力所能及的范围内,我们努力去了解人们正在经历哪些挑战。


Lex:所以你在倾听整个行业的细微风声,即那些蛛丝马迹。


黄仁勋:没错。你必须去倾听并向所有人学习,最后还要拥有一种灵活的架构。CUDA的优势之一在于,一方面,它是一个令人难以置信的加速器。另一方面,它确实非常灵活。因此,这种平衡,即专业化与通用化之间惊人的平衡,让我们能够适应不断变化的算法演进。我们目前处于CUDA 13.2版本,我们正在如此快速地演进架构,以至于能够与现代算法保持同步。


例如,当混合专家模型(MoE)出现时,这就是我们开发NVLink 72(NVL72)的原因。我们现在可以将一个价值数万亿参数的模型整体放入一个计算域中,就好像它在单个GPU上运行一样。


如果你观察Grace Blackwell机架的架构,它完全专注于做一件事:处理LLM。突然间,一年之后,你看到的已经是Vera Rubin机架了。它具备存储加速器,搭载了一款名为Vera的出色新型CPU。整个机架系统与上一代截然不同,它内部采用了所有这些新组件。之所以这样,是因为上一代产品旨在运行MoE大语言模型和推理任务,而这一代则是为了运行智能体(Agents)。而智能体会高频调用工具。


Lex:显而易见,该系统的设计一定是在Claude Code、Codex、OpenClaw发布之前就已经完成了,本质上你们是在预判未来。而这源于什么呢?源于坊间的传闻,还是对当前顶尖技术水平的理解?


黄仁勋:不,事情比这简单。你只需要进行第一性原理的推理。无论发生什么,为了让那个大语言模型成为一名数字员工,我们就使用这个比喻吧。假设我们希望LLM成为一名数字员工,它必须做什么?它必须能够访问真实数据(Ground truth),也就是我们的文件系统。它必须能够进行研究,因为它并非无所不知。我不想等到这个AI变得对过去和未来的一切无所不知之后,才让它发挥作用。因此,我不如现在就让它去进行研究。


显而易见,如果它想帮忙,就必须使用我的工具。很多人会说AI将彻底摧毁软件,我们不再需要软件了,甚至不再需要工具了。这太荒谬了。让我们用一个思想实验来探讨一下。你可以坐在那里,品着一杯威士忌,思考所有这些事情,一切就会变得显而易见。如果我要在未来10年内创造出最了不起的智能体,假设它是机器人,它是更有可能走进我的家使用我现有的工具?还是说它的手可以瞬间变成一把10磅重的锤子?为了烧开水,它是从手指中发射微波,还是更倾向于直接使用微波炉?当它第一次走到微波炉前可能不知道怎么使用,但这没关系,因为它连接着互联网,会阅读说明书,瞬间成为专家,然后它就可以使用它了。


Lex:所以我认为,我刚刚描述的其实就是OpenClaw的几乎所有属性,它将会这样去使用。


黄仁勋:它将会这样去使用访问文件的工具。它将具备进行研究的能力。它拥有I/O子系统。当你以那种方式推导并思考完这一切后,你会感叹它对未来计算的影响极其深远。原因在于,我认为我们刚刚重塑了计算机。


那么现在你可能会问,我们是什么时候开始思考这个问题的?如果你回顾两年前我在GTC上的演讲,你就会发现我当时就在讨论与今天OpenClaw如出一辙的智能体系统。


当然,这需要多种因素的汇聚方能实现。首先,我们需要Claude和GPT达到一定的能力水平。因此,它们的创新、突破以及持续的进步至关重要。当然,还需要有人创建一个足够稳健的开源项目。我认为OpenClaw对智能体系统的意义,正如ChatGPT对生成式系统的意义一样重大。


Lex:没错,这确实是一个非常特殊的时刻。它超越了Claude、Codex等的影响力,因为消费者能够直接触达它。当然,很大程度上这取决于氛围和模因,因为我们都在试图弄清楚这一切。


但当你拥有如此强大的技术时,确实存在非常严肃且复杂的安全顾虑:如何交出你的数据以供其处理而不失控。我们正在探寻如何找到恰当的平衡。


黄仁勋:我们立刻就投入其中,派出了许多安全专家。我们还做了名为Open Shell的项目,它已经被整合进OpenClaw中了。


Lex:NVIDIA也提出了NeMoClaw(或相关NeMo安全框架)。没错,它们的安装非常简单。


黄仁勋:这能确保其安全性。我们将智能体系统的能力分为三项:访问敏感信息、执行代码、进行外部通信。如果我们随时只为您提供这三项能力中的两项,而不是全部三项,我们就能确保底层安全。在此基础上,我们还根据企业授予的权限提供访问控制。我们将该系统连接到企业现有的策略引擎上。因此,我们将尽最大努力帮助OpenClaw成为更好的智能体系统。


能源瓶颈与数据中心的智能电力分配


Lex:你刚才非常精辟地阐述了我们历史上曾面临过许多被认为无法逾越的障碍,但最终我们都一一克服了。展望未来,Agent将无处不在,我们需要海量算力是毋庸置疑的。那么,实现这种规模化扩展的阻碍会是什么?


黄仁勋:电力确实是一个问题,但并非唯一的问题。这正是我们为何如此大力推进极致协同设计的原因,以便我们能够每年将“每瓦特产生的Tokens数量”提升几个数量级。在过去10年里,计算能力扩展提升了100万倍。我们将继续保持这一发展势头,通过极致的协同设计把能源效率发挥到极致。


因此,能源效率和每瓦性能完全影响着公司的营收。它影响着工厂的营收。我们将把这一点发挥到极致,尽可能快地持续降低Token成本。我们的计算成本在上升,但Token生成效率提升得快得多,Token成本每年都在呈数量级地下降。


Lex:所以克服电力瓶颈的方法是,通过提高每瓦每秒处理的Token数量使其变得越来越高效。当然,这里存在一个问题,即我们该如何获取更多的能源?这是一个非常复杂的问题。AI供应链中的瓶颈问题,例如拥有EUV光刻机的ASML,拥有先进封装技术CoWoS的TSMC,以及提供高带宽内存的SK Hynix。这在多大程度上让你夜不能寐?


黄仁勋:我们在时刻努力解决这些问题。历史上没有任何一家公司能在保持我们目前增长规模的同时,还在加速这一增长进程。在整个AI计算领域,我们的市场份额正在不断增长。因此,供应链的上下游对我们来说至关重要。我花了很多时间向我合作的所有CEO们说明,究竟是什么样的动态因素将推动增长持续?


这也是为什么在我的GTC主题演讲上,几乎坐满了整个IT产业上游和下游的几百位CEO。其中一部分原因是我在向他们告知我们目前的业务状况,介绍近期增长的驱动因素,描述未来的发展方向,以便他们能够利用这些信息为投资决策提供参考。所以我像告知自己的员工那样告知了他们。


随后我会亲自拜访他们并明确传达未来一年里将会发生的事情。如果你审视一下全球内存行业,你会发现第一大DRAM市场是数据中心。大约三年前,我成功说服了他们,尽管当时HBM内存的使用非常稀少,但我预见到它未来会成为数据中心的主流内存。起初这听起来很荒谬,但他们还是相信了并决定投资生产HBM内存。


另一种放入数据中心显得有些奇怪的内存,是我们用于手机的低功耗内存(LPDDR),我们希望将其适配到数据中心的超级计算机中。他们当时觉得惊讶,于是我向他们解释了原因。你看,这两款内存LPDDR-5和HBM4市场规模大得惊人,这三家拥有45年历史的公司都创下了历史最高纪录。


Lex:所以,这就是你工作的一部分:告知、塑造并激发灵感。你们正在构建未来的供应链,与TSMC、ASML进行沟通,包括上游和下游。


黄仁勋:还有电动汽车、Caterpillar(卡特彼勒)。没错,那是我们的下游。


Lex:整个半导体行业涉及极其艰巨的工程挑战。供应链的复杂程度以及组件数量之多让人感到恐惧,但它却以某种方式运作着。


黄仁勋:正是如此。深层科学、不可思议的制造工艺。我们有数百家供应商为机架贡献技术。每个机架包含130万到150万个组件。


Lex:Vera Rubin机架涉及200家供应商。所以有趣的是,你并没有将这一点列入那些让你夜不能寐的阻碍因素清单中。


黄仁勋:因为我正在做所有必要的事情,我已经把它勾选确认了,所以我可以安心睡觉。让我们来推敲一下这件事:我们将系统架构从原始DGX-1更改为了NVLink 72机架级计算。这对软件意味着什么?这对工程意味着什么?这对供应链意味着什么?


其中一层含义是,我们将超级计算机的集成工作从数据中心转移到了供应链中的超级计算机制造环节。比方说你希望拥有50吉瓦同时运行的超级计算机,制造需要一周时间,那么在供应链中,每周测试这些超级计算机就需要1吉瓦的电力。因此,我们需要供应链增加发货前构建和测试超级计算机所需的电量。


NVLink 72实际上是在供应链中构建了超级计算机,并以每个机架2到3吨的规格进行交付。过去通常是分部件运送,在数据中心内部组装。但现在这已经不可能了,因为NVL72的密度实在太高。我不得不深入供应链告诉合作伙伴:我们要改变以往构建DGX的方式。这将带来巨大的提升,因为我们需要用它们来进行推理。


Lex:推理市场正在到来。


黄仁勋:推理技术的拐点即将出现,这将是一个庞大的市场。我向他们解释了当前情况,并要求他们每个人进行数十亿美元的资本投资。因为他们信任并尊重我,我用第一性原理进行推导,等我向他们解释完时,他们就已经别无选择,只能照此执行了。


Lex:所以,我们很多工作都关乎人际关系,以及构建对未来的共同愿景。但你会担心某些瓶颈吗?你担心ASML的EUV工具设备吗?你担心封装技术,比如TSMC的CoWoS封装扩展产能的速度吗?供应链中的每个人都必须扩大规模,你是在和他们交流如何更快地扩展规模吗?


黄仁勋:因为我告诉了他们我的需求,他们理解我需要什么,也告诉了我打算去做什么,我相信他们会履行承诺。


Lex:那么,如果我们能稍微谈谈能源方面的话题,你对于如何解决能源问题有什么期许?


黄仁勋:这是我非常希望能传达出去的一个领域。我们的电网是按照最极端情况下的负载需求进行设计的,并留有余量。实际上,99%的时间里,我们的负载远未达到极端情况(只发生在冬夏季极端天气)。电力负荷可能仅在峰值的60%左右波动。因此,99%的时间里,我们的电网都拥有闲置的富余电力。但这些储备必须保持闲置待命,确保在关键时刻医院、机场能获得持续供电。


我考虑的问题是,我们是否可以去协助他们,通过设计计算机架构和数据中心,从而在社会基础设施需要最大电力供应时,主动降低数据中心的用电量?在那段时间里,我们可以通过备用发电机来应对,或者将计算工作负载转移,亦或是让计算机降低运行速度。我们可以牺牲一定的性能来降低功耗,提供响应延迟略微增加的服务。与其要求数据中心百分之百的正常运行时间,给电网带来了巨大的压力,我只是想利用它们闲置的多余电力。


Lex:没错,关于这一点讨论得还不够。阻碍因素是什么呢?是监管吗?


黄仁勋:我认为这是一个传输通道的问题。问题始于最终客户对数据中心提出了绝不能中断服务的完美要求。为了实现这种完美交付,云服务商必须寻求公用事业部门的支持,期待实现99.9999%的可用性。我认为首要任务是确保客户的CEO们明确他们所提出的要求意味着什么。


其次,我们必须构建能够实现“平滑降级(Graceful Degradation)”的云数据中心。如果电网告知我们需要将供电量下调至80%,我们会回应这完全没有问题。我们只需灵活调度工作负载,确保数据绝不丢失,通过降低计算速率来减少能源消耗。此时服务质量略微下降,对于关键工作负载,我会立即切换到其他区域。


Lex:那么,在数据中心实现智能动态电力分配,在工程上有多大的难度?只要你能将其具体化,遵循第一性原理的物理定律,你就能设计出来。第三件事是我们需要公用事业部门也认识到这是一个机遇。


黄仁勋:没错。如果公用事业公司也能提供更多细分的弹性电力输送方案,每个人都能想出如何利用它。目前的电网中确实存在太多的浪费了,我们应该着手解决这个问题。


极致工程:埃隆·马斯克与“光速”原则


Lex:你高度赞扬了Elon Musk和xAI在Memphis建造Colossus超级计算机的成就,在短短4个月内拥有了10万颗GPU(正迈向20万颗)。关于他的工程方法,有什么能启发我们的?


黄仁勋:首先,Elon是一位非常出色的系统思想家,能够跨越多个学科深入思考。他不断质疑一切:“这有必要吗?非得用这种方式做吗?需要这么久吗?”他有能力将事物精简到仅剩必要的最低限度,无法再删减任何东西,但产品保留的功能依然完备。他是在系统规模上做到这一点的。


我也喜欢他亲力亲为,直接出现在行动的第一现场。如果出了问题,他会亲自去现场查看。当你以极其紧迫的态度亲力亲为时,这会带动整个供应商体系打破“我们一直都是这样做的”思维定势。他通过实际行动,确保自己成为每个人心中最重要的优先事项。


Lex:没错,亲自掌握地面真值(Ground Truth),从头到尾仔细查看如何将线缆插入机架的整个过程。通过对细节积累直觉,你就能在微观和宏观层面察觉效率低下的地方,并且消除所有可能的阻碍因素。在你看来,NVIDIA极致协同设计方法与Elon处理系统工程的方式之间是否存在相似之处?


黄仁勋:嗯,首先,协同设计是终极的系统工程问题。我们30年前开始使用一种方法,我称之为“光速(Speed of Light)”原则。光速不仅仅是指速度本身,它指的是物理学所能达到的理论极限是什么。


我们所做的一切(内存速度、运算速度、功耗、制造成本、交付时间)都会拿来与物理极限进行对比。当你思考延迟与吞吐量时,你需要对照物理极限来分别测试。旨在实现极高吞吐量的系统与低延迟系统,其物理极限是不同的。当你思考整个系统时,就可以进行权衡取舍。


Lex:所以你强迫每个人在做任何事情之前,都要思考其第一性原理和物理限制,并以此作为基准来测试一切。


黄仁勋:这是一种很好的思维框架。我不喜欢所谓“持续改进”的方法。持续改进的问题在于,你应该从第一性原理出发,以物理极限为思考基准。我不喜欢有人对我说:“现在完成这件事需要74天,明年可以在72天内为你完成。”我宁愿把它彻底清零。


首先请向我解释为什么最初需要74天?如果完全从零开始,仅受限于物理定律,最快需要多长时间?可能只需要6天。既然你已经知道6天是可行的,那么我们将方案从74天压缩到6天的讨论,效率就会出奇地高得多。


Lex:在处理这些极其复杂的系统中,比如Vera Rubin架构包含了7种芯片、40个机架、1.2千万亿个晶体管、近20,000个NVIDIA裸片、超过1,100个Rubin GPU、60 Exaflops的算力以及每秒10 PB的扩展带宽。单单一个NVL72机架就有130万个组件,重达4000磅。在进行设计时,你会将“简洁”作为追求的指标吗?


黄仁勋:为了让你有个直观的认识,我们每周大概会生产约200个这样的超级计算集群。我最常说的一句话是:“我们需要让事物具备必要的复杂性,但同时要尽可能简单。”我们应当对所有的复杂性进行验证和质疑,任何多余的部分都是不必要的。


Lex:NVIDIA所做的是历史上最伟大的工程奇迹。这是世界上有史以来制造出的最复杂的计算机。如果这相当于工程团队的奥林匹克竞赛,台积电(TSMC)和ASML在每一个规模上都非常出色,但NVIDIA绝对是汇聚金牌得主的强劲团队。


黄仁勋:确实是令人难以置信的团队。每一项运动的金牌得主都汇聚于此。


中国科技生态与开源的未来


Lex:你最近去了中国。对于中国如何在过去10年里建立起如此多世界一流的公司、工程团队以及技术生态系统,你是怎么看的?


黄仁勋:让我们从事实开始。全球约有50%的AI研究人员是华人,他们中的大多数人在中国。他们拥有令人惊叹的科研人才。加之该国极高的科学与数学教育水平,在移动云时代,他们的科技产业是在软件时代建立起来的,对现代软件非常适应。


中国并非一个单一的经济体。它拥有许多省份和城市,地方政府都在相互竞争,这是为什么会涌现出如此多电动汽车(EV)和AI公司的原因。结果就是,他们内部存在着疯狂的竞争。


同时,他们拥有一种社会文化,即家庭第一,朋友第二,公司第三。工程师之间的校友和朋友关系深厚。


黄仁勋:所以,他们之间往来的交流非常多,本质上他们一直都在开源。


黄仁勋:因此,它们为开源做出更多贡献是理所应当的,因为它们大概会想,我们到底在保护什么呢?我的工程师们,他们的兄弟在那家公司,他们的朋友在那家公司,而且他们都是校友,那种校友理念。这是一种“一日为校友,终身为兄弟”的关系。所以,它们分享知识的速度非常、非常快。因此,根本没有必要隐藏技术。你不妨把它开源。于是开源社区就会进行放大。它加速了创新进程。所以,得益于开源以及朋友间的相互协作,你能获得这种迅速汇聚的顶尖人才和快速的创新。而在公司之间疯狂的竞争下,涌现出了令人难以置信的成果。因此,这是当今世界上创新速度最快的国家。而这一切——我刚才所说的每一件事——对于孩子们的成长方式都至关重要,无论是他们拥有卓越的教育、父母对他们学业的重视,还是他们的文化氛围,这些都是他们国家的特质。而且他们正好出现在技术经历指数级增长的关键时刻。


Lex:此外,从文化上讲,成为一名工程师是一件很酷的事情。这与你提到的所有要素都是相连的。这是一个建设者国家。


黄仁勋:这是一个建设者国家。我们国家的领导人固然了不起,但他们大多是律师出身。而他们的国家领导人,由于旨在保障国家安全、维护法治与有效治理,他们的国家是在贫困中建立起来的。因此,他们的大多数领导人都是卓越的工程师,拥有极其睿智的头脑。


Lex:顺便提一下,既然你提到了开源,我必须提到Perplexity,你一直很支持它,很久了。我非常喜欢它。感谢你们发布了开源的Nemotron,这太棒了,你也可以在Perplexity内部使用它来查询信息,它是一个拥有1200亿参数的开源权重MOE模型。你对开源的愿景是什么?你提到了中国,比如DeepSeek或MiniMax,这些公司确实在极大地推动开源AI运动。而NVIDIA也在引领接近最先进水平的开源LM。你对此有何愿景?


黄仁勋:首先,如果我们想成为一家伟大的AI计算公司,就必须了解AI模型是如何演进的。我喜欢Nemotron的原因之一是它不仅仅是一个纯粹的Transformer模型。它是Transformer和SSM的结合。我们很早就开始开发条件GAN,即Progressive GAN,这逐步引领了扩散模型的产生。因此,我们在模型架构和不同领域进行基础研究,使我们能够洞察什么样的计算系统才能更好地支持未来的模型。所以,这是我们极致协同设计战略的一部分。


其次,我认为我们理所当然地认识到,一方面我们希望拥有世界一流的模型作为产品,这些产品应该是专有的。另一方面,我们也希望AI能够普及到每一个行业、每一个国家、每一位研究人员和每一位学生中。如果一切都是私有的,那么进行研究、在现有基础上进行创新或围绕其开展工作都将变得困难。因此,开源对于许多行业加入人工智能革命而言是根本必要的。NVIDIA拥有相应的规模,而我们不仅拥有技能、规模和动力,还有在有生之年持续构建这些人工智能模型的动机。因此,我们理应这样做。我们可以开放源代码,能够激活每一个行业、每一位研究人员以及每一个国家,使他们都有能力加入人工智能革命。


第三个原因是基于对人工智能不仅仅是语言这一事实的认识。这些人工智能很可能会使用在其他信息模态上训练过的工具、模型和子智能体。也许是生物学、化学,或者是物理定律、流体力学和热力学,并非所有这些内容都存在于语言结构之中。因此,必须有人站出来确保天气预测、生物学、面向生物学的人工智能、物理人工智能等所有这些领域都能被推向极限,并推向最前沿。我们不制造汽车,但我们希望确保每一家汽车公司都能获得出色的模型。我们不做药物研发,但我希望确保Lilly(礼来)能够拥有全球最顶尖的研发能力。包括生物学、AI以及各种系统,以便他们能够利用这些工具进行药物发现。


基于这三个基本原因:认识到AI不仅仅是语言模型,意识到AI的范畴非常广泛,我们希望让每个人都能参与到AI的世界中,同时也包括AI的协同设计。


Lex:说实话,我必须再次感谢你们以真正开源的方式发布了Nemotron。


黄仁勋:谢谢,我很感激你能这么说。我们开源了模型。我们开源了权重。我们开源了数据。我们开源了我们构建这些成果的方法。这非常了不起。


Lex:确实令人难以置信。


TSMC:技术、制造与信任的奇迹


Lex:你来自台湾,且与TSMC(台积电)有着密切的联系。所以我必须问一下TSMC,我认为这家公司在工程团队和他们所展现出的令人难以置信的工程成就方面,同样是一家传奇性的公司。你对TSMC的企业文化及其运作方式有何理解?是什么让他们能够在半导体领域的所有业务中取得这种独一无二、无可匹敌的成就?


黄仁勋:首先,关于TSMC最深刻的误解就是认为他们拥有的仅仅是技术。


Lex:认为他们只是拥有某种非常出色的晶体管。并觉得如果有人拿出了另一种晶体管,他们就完了。


黄仁勋:当然,这里所说的技术,我指的不仅仅是晶体管和金属化系统,还包括封装、3D封装(CoWoS)、硅光子技术,以及他们所掌握的所有相关技术。正是这些技术使该公司变得卓越。他们的技术造就了这家公司的非凡之处。


Lex:但真正关键的是他们协调全球数百家公司需求的能力——这些需求是动态的,包括不断调整、转移、增加、减少、推迟、提前,在客户之间切换,晶圆启动、晶圆停止、紧急晶圆启动等等,这些都是动态变化的。


黄仁勋:在世界时刻塑造和演变的过程中,面对如此复杂的全球动态,他们却能以某种方式高效地运营着工厂。具备高吞吐量、高良品率、极具竞争力的成本以及卓越的客户服务。他们对待工作严谨,对待承诺信守不渝。当你作为客户时,因为他们深知自己在协助你运营公司,所以当承诺交付晶圆时,晶圆总会如期而至,让你能够顺畅地经营公司。因此,他们的系统,也就是他们的制造系统,堪称奇迹。


我想说的第二点是他们的企业文化。这种文化一方面专注于技术,推动技术进步;另一方面又同时兼顾客户服务导向。很多公司非常注重客户服务,但在技术上并不卓越。他们并非处于技术的最前沿;又或者很多公司处于技术最前沿,却并非最优秀的客户服务型公司。而他们以某种方式在这两者之间取得了平衡,并在两个领域都达到了世界级水准。


最后,我认为我在他们身上最看重的第三点,是他们创造了一种名为信任的无形资产。我相信他们能把我的公司置于他们的首要位置。这意义非常重大。


Lex:他们信任,你们之间已经建立起了一种非常紧密的关系,这种信任是基于多年来的表现建立的,但其中也包含了人际关系。


黄仁勋:三十年了。不知道我们通过他们完成了多少个十亿甚至百亿美元的业务。而且我们之间甚至并没有合同。这真是太棒了。


Lex:了不起。有一个传闻说在2013年,TSMC的创始人张忠谋(Morris Chang)曾向您提供机会,邀请您担任TSMC的首席执行官。而您说您已经有工作了。这个故事是真的吗?


黄仁勋:这个故事是真的。但我深感荣幸。我当时就知道,正如我现在所知,TSMC是历史上最具影响力的公司之一。Morris是我一生中最为敬重的高管、商业伙伴和个人挚友之一。他提出请求,让我感到诚惶诚恐,也倍感荣幸。但我在这里所做的工作非常重要。我曾在脑海里预见到NVIDIA将会成为什么样子,以及我们能够产生什么样的影响力。这是一项非常重要的工作。这是我的责任,实现这一目标是我唯一的责任。所以我拒绝了,并非因为它不是一个不可思议的提议。这是一个令人难以置信的提议,但我实在无法接受。


Lex:我认为NVIDIA和TSMC是人类文明史上最伟大的两家公司。我相信经营其中任何一家公司,都是一项极其复杂的工作。投入其中,你必须真正全情投入。


黄仁勋:是的。每个人在各个层面,不仅仅是在CEO层面,每个人都确实是全情投入的。要完成这种复杂程度的工作。你看,现在我可以同时帮助这两家公司了。


NVIDIA的护城河与计算的未来


Lex:没错。所以,NVIDIA现在是世界上最有价值的公司。我不得不问,正如科技界人士所言,NVIDIA最大的护城河是什么?就是那种能让你免受竞争影响的优势。


黄仁勋:作为一家公司,我们最重要的资产就是我们计算平台的安装基数(Installed Base)。


我们最重要的事情,归根结底就是今天CUDA的安装基数。20年前是没有安装基数的。但如果有人现在搞出了什么Gouda或Tuda,那也完全没有任何影响。原因在于,这从来都不仅仅是关于技术的问题。当然,这项技术本身极具远见。但关键在于公司对它的专注、坚持,以及不断拓展其覆盖范围。并非三个人成就了CUDA的成功。是43,000名员工成就了CUDA的成功。还有数百万开发者相信我们,他们信任我们将持续迭代CUDA 1、2、3以及13版本,因此决定将他们的软件迁移并构建在我们的平台上,将他们庞大的软件生态筑基于此。


因此,安装基础是第一大最重要的优势。当这一安装基础与我们在此规模下的执行速度相结合时——历史上没有任何公司曾构建过如此复杂的系统,更不用说要以每年一次的频率完成迭代,这简直是不可能的。这种速度与安装基础相结合,从开发者的角度来看,如果我支持CUDA,明天它就会变得比现在好10倍,我平均只需要等待六个月。不仅如此,如果我在CUDA上进行开发,我能触达数亿用户和计算机。我存在于每一个云端。我存在于每一家计算机公司。我存在于每一个行业之中。我存在于每一个国家之中。


Lex:如果我将其作为一个开源软件包并首先放在CUDA上,我将同时获得性能和生态广度这两个属性。


黄仁勋:不仅如此,我百分之百相信NVIDIA会一直保留CUDA,维护它、改进它,并终其一生不断优化相关库。对此你可以深信不疑,特别是最后提到的那一点——信任。将所有这些因素综合在一起。如果我是今天的开发人员,我会首先以CUDA为目标。我会最优先针对CUDA进行开发。我认为归根结底,这就是我们最初的,甚至是我们首要的核心优势。


第二个是我们的生态系统。事实上,我们将这个极其复杂的系统进行了垂直整合,并将其水平整合到了每一家公司的计算机中。我们入驻了Google Cloud。我们也入驻了Amazon。我们入驻了Azure。我们目前正在疯狂地提升AWS的规模。我们入驻了像CoreWeave和N Scale这样的新公司。我们还入驻了Lilly的超级计算机中。我们入驻了企业级计算机。我们处于无线电基站的边缘计算端。这简直不可思议。一种架构应用于所有这些不同的系统中。我们入驻了汽车行业。我们涉足了机器人领域。我们涉足了卫星领域。我们正置身于太空之中。因此,生态系统中拥有这一单一架构本身就极具广度。它基本上覆盖了全球范围内的每一个行业。


Lex:那么,在以AI Factories作为护城河的情况下,CUDA的装机基础将如何向未来演进?你认为未来的NVIDIA是否有可能完全围绕AI Factory展开?


黄仁勋:对我们来说,计算的基本单位曾经是GPU。后来它变成了计算机。随后它变成了一个集群。现在它已是一整座AI工厂。当我看到计算机,看到NVIDIA所构建的一切时,在过去,我脑海中浮现的是芯片。然后当我发布新产品时,比如新一代产品,我会说,女士们先生们,我们今天发布Ampere,然后我拿起那块芯片。


Lex:那曾是构建产品的思维模型。


黄仁勋:今天,我不会那么做了,拿起芯片现在看来还有点可爱。这已经不再是我所从事工作的思维模型了。我的思维模型是这个巨大的吉瓦级(Gigawatt)事物,它拥有发电能力,连接着电网,并且具备冷却系统以及规模极其庞大的网络架构。要知道,有10,000人在里面试图进行安装,有数百名网络工程师在里面。启动其中一家工厂并非是一个人说一声“现在启动”那么简单,需要数千名工程师在幕后努力将其投入运行。


Lex:所以从思维上讲,当你思考计算单元时,你考虑的已经不再是单个机架,而是计算集群(pods)。这不再是单个芯片的问题。


黄仁勋:而是整个基础设施。我期待我的下一次进阶是当我在思考构建计算机时,它的规模已经是行星级的了。那将是下一次进阶。


太空计算与能源的极致利用


Lex:你如何看待Elon提到的关于在太空中进行计算以解决部分能源问题、从而使能源扩展变得更容易的设想?散热问题并不简单,这涉及到大量的工程复杂性。NVIDIA也宣布你们已经在考虑这件事了。


黄仁勋:我们已经在做了。NVIDIA GPUs是第一批进入太空的GPUs。我们已经在太空中了。相当于给我们的一个GPU穿上一件小小的宇航服。这是一个进行大规模成像的绝佳场所,因为那些卫星配备了超高分辨率的成像系统,目前正在持续对地球进行扫描。你想要的是能够对全球进行持续的厘米级成像,以便实现对一切事物的实时遥测。你不会想把这些数据全部传回地球,那可是成PB级的数据量。你必须直接在边缘端运行AI,丢弃所有不需要的信息,只保留你需要的部分。所以AI必须在边缘端完成。


显然,如果我们将其部署在极地轨道,就能拥有全天候的太阳能。但那里没有热传导,也没有热对流。所以你基本只能依靠热辐射。而且,太空非常广阔,我想我们只是打算在那儿放置极其巨大的散热器。


Lex:你认为这个想法有多疯狂?比如,这是5年后、10年后,还是20年后的事情?这是讨论AI扩展的潜在障碍。


黄仁勋:我个人务实得多。我首先关注的是下一个机遇在哪里。与此同时,我正在培育太空领域,所以我派遣了工程师去研究这个问题。我们才刚刚起步,正在从中学习到很多。我们该如何进行辐射防护?我们该如何处理性能衰减?如何处理缺陷的持续测试与认证?我们要如何处理冗余性问题,以及该如何实现优雅降级?软件方面该怎么办?你如何看待太空环境下的软件冗余和性能问题,让计算机永远不会崩溃,它只会变得更慢。


因此,我们可以从前期开始进行大量的工程探索。但在此期间,我最喜欢的答案依然是消除浪费:我们拥有地球上电网中那些闲置的庞大算力资源,我希望尽快将其释放出来。


Lex:在地球上还有许多唾手可得的资源,我们可以利用它们来实现AI的规模化扩展。(注:Lex播客赞助商鸣谢环节——Perplexity,Shopify,Element,Fin,Quo)


Token工厂与生成式计算的新纪元


Lex:现在回到对话。你认为NVIDIA在未来某个时刻市值可能达到10万亿吗?让我们换个方式来问:如果这种情况成为现实,未来的世界会是什么样子?


黄仁勋:我认为NVIDIA的持续增长极有可能实现,在我看来这是必然的。我们是历史上最大的计算机公司,这背后的原因有两个基础性的底层技术逻辑。


首先,计算模式发生了根本转变:从过去“基于检索的文件系统”转变为“具备语境感知能力的实时生成系统”。过去,几乎所有东西都是一个文件。人类预先编写、录制或绘制内容,存入文件发布在网络上,然后利用推荐系统来为你检索内容。因此,计算机曾是一个预录制与文件检索系统。时至今日,AI计算机必须实时处理并生成Token。唯一会导致这种方式倒退的情况,就是如果这种“生成具有语境相关性和情境感知能力”的计算方式被证明是无效的。


Lex:如果在过去的10到15年里,我们得出结论说这行不通。


黄仁勋:如果认为这是一个死胡同,无法扩展、无法解决多模态问题,那我当然会有非常不同的感受。但我认为,过去五年给了我比之前十年更多的绝对信心。


第二个技术逻辑是,过去的计算机曾是一个存储系统,在很大程度上是一个赚不了多少钱的仓库。我们现在正在建造工厂,工厂是直接用于创造商业收益的。


Lex:所以计算机不仅改变了其运作方式,它在世界上的目的也发生了改变。


黄仁勋:它不再是一台传统的计算机,它是一家创造收益的工厂。这座工厂生产的商品,就是极具价值的Token(智能)。我们看到这些商品对如此多不同的受众具有价值,以至于Tokens开始像iPhone一样进行细分:免费的、付费的以及中间档次的。事实证明,智能成为了一种可扩展的产品。人们愿意为专门用途的超高智能Token支付每百万1000美元的费用,这并非是否会发生的问题,而只是时间早晚。


现在的问题是:世界需要多少座这样的工厂?需要多少个Token?社会愿意为这些Token付出多少代价?如果生产力得到如此大幅度的提升,世界经济将会发生什么?我们将会发现新的药物、新的产品、新的服务。


Lex:当你将这些因素结合起来看时,我确信世界GDP的增长将会加速。


黄仁勋:我完全确信GDP中能够加速增长的那部分比例。将用于计算基础设施的资源将比过去多出100倍,因为它不再仅仅是一个存储单元。


Lex:它是一个产品生成单元。


黄仁勋:当你从这个角度去回溯NVIDIA扮演了什么角色时,我们必须从中受益以应对这种新的经济。对我而言,NVIDIA突破3万亿甚至更高的市值是否可行?答案当然是肯定的。原因在于它不受任何物理极限的束缚,没有任何迹象表明这是不可能的。事实上,NVIDIA的供应链负担由200家公司共同分担,我们依托这一生态系统的伙伴关系进行规模化扩展。问题是我们是否有足够的能源来做到这一点?我们当然会有足够的能源。


Lex:综合所有这些因素,那个市值数字仅仅只是一个数字。


黄仁勋:我仍记得,NVIDIA第一次突破10亿美元营收时,一位CEO提醒我:“一家无晶圆厂半导体公司营收超过10亿美元在理论上是不可能的。”这在逻辑上是不通的。后来又有人告诉我,由于其他公司的存在,NVIDIA的市值永远不会超过250亿美元。这些都不是基于第一性原理的思考。考虑这个问题的简单方法是:我们制造的是什么,我们能创造的增量机会有多大?


NVIDIA并不从事“抢占现有市场份额”的竞争业务,因为我刚才提到的增量市场目前根本不存在。


Lex:如果你们是试图夺取份额的公司,股东很容易理解占据10%份额能达到多大规模。


黄仁勋:但人们很难想象我们能达到多大规模,因为根本没有我可以从中抢占份额的对象。这是世界对未来的想象力挑战。每一届GTC都会让这个庞大的增量市场变得越来越真实,我们百分之百会实现它。


Lex:没错,本质上就是Token工厂,即每瓦特每秒生成的Token数量。每一个Token都切实带来价值,这才是真正的产品。第一性原理是:考虑到AI所能解决的所有潜在问题,展望未来,社会将需要指数级增长的Token工厂。


黄仁勋:完全正确!我之所以对此如此兴奋,是因为Token时代的“iPhone时刻”已经到来。你管那个叫什么?等等,你是说OpenClaw吗?智能体(Agent)。


Lex:确实,泛指各类Agent。Token时代的iPhone已经到来了。


黄仁勋:这是历史上增长最快的应用程序,呈现直线飙升的态势。这点毋庸置疑。OpenClaw就是Token时代的iPhone。


Lex:从大约12月开始,人们真正意识到了Claude Code、Codex和OpenClaw的强大威力。我很不好意思承认,在去机场的路上,这是我第一次在公共场合通过对着笔记本电脑说话进行“编程”。我感到尴尬是因为我表现得就像在和人类同事交谈。但这确实是完成工作的高效方式。


黄仁勋:更有可能的情况是,你的AI会一直来打扰你。因为它完成任务的速度实在太快了,它一直在向你汇报进度:“我已经完成了,接下来想让我做什么?”大多数人没有意识到的一点是,未来与他们交流、发短信最多的人,将会是他们的智能体(Claws)。这将是一个多么不可思议的未来。


承受苦难、学会遗忘与“这能有多难?”


Lex:我读到过你将自己的大部分成功归功于比任何人工作更努力,并能承受比任何人更多的痛苦:应对失败、工程问题的代价、精疲力竭、尴尬,以及公司濒临倒闭的绝境。现在作为NVIDIA的CEO,全球的经济体和国家都围绕着NVIDIA规划人工智能基础设施。你如何应对如此巨大的压力?是什么给了你力量?


黄仁勋:我意识到NVIDIA的成功对美国非常重要。我们创造了巨额税收,为国家确立了对国家安全至关重要的技术领先地位。我们在美国推动了大规模的再工业化,创造了海量就业,将工厂、芯片制造带回美国。我有幸接触到主流投资者、教师、警察,他们因为投资了NVIDIA或看了Jim Cramer的股票节目买入股票成为了百万富翁,这是一份真正的礼物。


我完全了解情况。我意识到NVIDIA是一个庞大生态系统网络的核心。所以我处理压力的方式就是思考既定事实:我们在做什么?造成了什么结果?像供应链这样承受巨大负担的影响是怎样的?


Lex:问题在于,你打算对此做些什么?


黄仁勋:在几乎所有我感受到的事情中,我都会进行拆解和推演:当前的状况是什么?困难之处在哪里?打算如何处理?通过解构转化为我能够处理的具体事项。之后我唯一能做的就是问自己:你做了吗?如果你推断出需要做却没做,那就别再抱怨了。


我对自我要求相当严格。我通过将事物拆解,确保自己不会陷入恐慌。我能够安然入睡,因为我已经列好了所有需要完成的清单。我确保一切可能使公司和行业陷入困境的危机都得到了妥善处理。我已将所有隐患都告知了有能力采取行动的相关人员。所以我已经放下心事。在那之后,你还能做什么呢?


Lex:既然在创业过程中经历了如此疯狂、深重的苦难,你是否曾陷入过心理低谷?


黄仁勋:当然,一直都有。


Lex:你只需要把问题拆解成若干部分。


黄仁勋:看看你能对此做些什么。而且,很大一部分能力在于“遗忘”。正如AI学习最重要的特质之一就是系统性的遗忘,你需要知道何时该忘记。你不可能背负所有东西。我会尽可能快地分担负载,无论什么让我担忧我都会告诉别人,通过拆解成较小的部分,激励团队参与解决。


学会遗忘意味着很多时候你必须对自己狠一点:“得了吧,别再为这事哭哭啼啼了,行动起来。”然后从床上爬起来。另一部分原因是你会被下一个光鲜亮丽的目标吸引,就像伟大的运动员只关心下一分,上一分已成过去。因为我的工作大部分在公共视野下进行,我说过很多当时觉得合理有趣的话,事后反思发现并无价值,那些尴尬和挫折会让你感到意外。


Lex:但你基本上允许自己被未来的光芒所指引,忘记过去不断努力。你曾说过一句众所周知的话:如果早知道创办NVIDIA会比预想困难一百万倍,你可能就不会去做了。


黄仁勋:但这对于所有值得去做的事情可能都是真实的。保持“初学者心态(Beginner's Mind)”拥有一种难以置信的超能力。


Lex:当我审视某样事物时,我经常这样对自己说。


黄仁勋:我首先想到的是:“这能有多难呢?”即使这件事从来没人做过,极其宏大,将耗资数千亿美元,你只会想:“这能有多难呢?”


你必须进入那种心态。你真的不想提前去过度模拟所有的挫折、磨难和失望。你想要带着“一切都会很完美”的想法去迎接新体验。当挫折真的发生时,你需要具备持久的韧性。耻辱和尴尬会让你感到意外,但你不能放任自己,必须开启另一种状态:干脆忘掉它,继续前进。


Lex:只要我对未来为何显现的逻辑假设没有发生实质性改变,预期结果就不会改变。


黄仁勋:因此,我模拟出的未来愿景仍将实现。


Lex:如果它依然会实现,我仍会为之努力。


黄仁勋:这结合了人类的几种特质:以全新的心态投入体验的能力、遗忘挫折的能力,以及坚持你所信奉理念的能力。保持信念忠诚的同时不断重新评估。将这些特质结合对韧性至关重要。我很幸运具备这些特质,我总是保持好奇,不断学习虚心求教。我总是惊叹别人处理得真好,我很好奇他们的思考过程,我几乎在效仿我所观察到的每一个人并给予尊重。


财富、名望与谦逊


Lex:你现在是地球上最富有、最成功的人之一。保持谦逊是否变得更难了?金钱、权力和名望是否让你在内心更难承认错误,从而难以倾听相左的意见?


黄仁勋:令人惊讶的是并没有,实际上我会持相反观点。


Lex:因为你的大部分工作都是公开进行的,所以当你犯错时所有人都能看到。


黄仁勋:这会让你变得谦卑。大多数我在公开场合发表的言论,我都是相当确信的,因为这会影响他人,我非常谨慎。但在会议内部推演的事情,结果可能会大不相同,但这从未阻止我进行推演。我管理和领导的方式是:我始终在人们面前公开进行逻辑推演。就像和你交谈时,我会向你展示得出结论的过程,让你自行判断是否认同。


我整天在与员工的会议中这样做进行推导。这让每个人都有机会介入并反驳我。通过公开推理并让人们参与,好处在于他们不必全盘否定结论,可以不同意推理步骤将我引向不同方向,我们把它变成了一种集体的路径搜索方法。


Lex:你在解释事物时有一种特质,我能感觉到你是在现场实时进行推理,保持开放的心态,让我感觉可以引导你的思维。在经历了多年成功与痛苦后还能保持这种状态非常美好。有时痛苦会让人封闭,保持开放并不容易。


黄仁勋:我认为,对尴尬的承受力是必须的。


Lex:是的。你会有很多年都在让自己出丑,当周围人看着你发表观点被证明是错的,你能承认并从中成长,这在人类层面非常困难。


黄仁勋:反正他们都知道,我最近的第一份工作是在Denny's餐厅打扫厕所,所以没什么放不下的。


Lex:我很高兴你保持了在Denny's工作时同样的精神。那段旅程是一段美好的经历。让我问你一些关于电子游戏的问题。


电子游戏:从Doom到DLSS-5


Lex:我是一个忠实的玩家。必须感谢NVIDIA多年来带来的令人难以置信的图形表现。


黄仁勋:顺便说一下,直到今天GeForce仍然是我们排名第一的营销策略。人们在青少年时期玩《Call of Duty》或《Fortnite》开始了解NVIDIA,上大学后开始使用CUDA,再后来在专业领域使用NVIDIA。


Lex:包括Blender及各种专业软件。硬件确实让游戏世界栩栩如生。但围绕DLSS-5产生了一些争议。网上的玩家担心这会让游戏看起来像是AI生成的劣质内容。你对这场风波有什么看法?


黄仁勋:我认为他们的观点有道理,我本人也不喜欢千篇一律的AI劣质生成内容。但这并不是DLSS-5想要实现的目标。DLSS-5是基于3D几何条件引导的,完全忠实于地面真值(Ground Truth)和结构化数据。几何结构由艺术家决定。


Lex:完全忠实于几何结构。


黄仁勋:树木在每一帧中保持原样,受纹理和艺术表现制约。每一帧它只会进行增强,并不会改变任何核心内容。


Lex:由于DLSS系统是开放的,开发者还可以训练自己的模型,未来甚至通过提示词引导风格。


黄仁勋:比如我希望它是一个卡通渲染器风格,你给它一个示例,它就会以该风格生成,且完全符合艺术家的创作意图。误解在于人们以为游戏发布后由我们强行加一层后期处理滤镜,这并非DLSS设计初衷。DLSS是与艺术家深度集成的生产力工具,旨在服务艺术家创造更精美的作品。


Lex:人们对完美的图形有时并不感冒,反而追求那些不完美。只要这些是帮助我们创造世界的工具就太棒了。


黄仁勋:这不过是又一种工具罢了。希望生成模型能创作出截然不同的风格,它能做到。


Lex:过去几年为游戏开发者引入了皮肤着色器。


黄仁勋:包含了次表面散射技术让皮肤更具真实感。整个行业都在寻求更多工具表达艺术。他们可以决定使用什么。


Lex:荒谬的问题:从NVIDIA视角来看,你认为有史以来最具影响力的游戏是什么?


黄仁勋:《Doom》(毁灭战士)。毫无疑问,那是3D游戏的开端。《Doom》在文化意义和行业影响交汇点上,推动行业将PC从办公设备变成了家庭游戏设备。从实际的图形技术角度看,我会说是《Virtua Fighter》(VR战士)。


Lex:《Cyberpunk 2077》完全重构了路径追踪图形效果,真的很棒。另外我个人非常喜欢《Skyrim》(上古卷轴),人们为其发布了各种Mod简直像全新游戏,让人重新体验钟爱的世界。


黄仁勋:我们开发了一个叫做RTX Mod的工具,允许社区将最新的光追技术注入到一款老游戏中。


Lex:成就伟大游戏的不仅是图形还有故事塑造,但精美图形确实增加沉浸感。关于AGI时间表取决于对AGI定义。我们用一个荒谬的定义:一个能胜任你工作(创办并经营一家估值超十亿美元科技公司)的AI系统。你了解完成所有这些组件多困难,包括创新、寻找客户、销售、建立由智能体和人类组成的团队。这需要5年、10年还是20年才能实现?


AGI与职业的演变:放射科医生的启示


黄仁勋:我认为我们已经实现了AGI。由这样的AI系统来运营一家估值十亿的公司是可能的。因为你刚才提到的金额是十亿,并没有说那公司必须“永远”存活。完全不排除OpenClaw创建一个网络服务或有趣的小应用,吸引几十亿人以极低价格使用。


Lex:然后它就倒闭了。


黄仁勋:不久之后倒闭。互联网时代这类公司很多,大多数网站的复杂程度并不比今天OpenClaw生成的水平高。


Lex:实现病毒式传播并变现,你这句话会让很多人兴奋,随意启动智能体赚很多钱。


黄仁勋:这种情况现在确实正在发生。去中国你会看到很多人在教导智能体,让它们走出去寻找工作赚钱。如果有人创造了一个超级可爱的数字影响力者或社交应用(像Tamagotchi电子宠物),取得瞬间成功我并不惊讶。当然,那10万个智能体去构建NVIDIA的概率是0%。


我们必须认识到人们确实在为工作担忧。我从事这份工作34年了,是世界上任职时间最长的科技公司CEO。这34年里我完成工作的工具一直在改变。我想提醒大家:你工作的目的与你完成任务的工具是相关联的,但并非一回事。


我想分享一个故事:多年前,计算机科学家一致认为第一个被取代的职业将是放射科医生。因为计算机视觉确实在2019年左右就已超越人类水平。当时的预测是放射科医生会消失,研究扫描图已成过去式。


Lex:如今每一个放射学平台都由AI驱动,然而放射科医生数量却增长了。


黄仁勋:全球范围内甚至面临放射科医生短缺。为什么那种危言耸听的警告错了?因为放射科医生的宗旨是“诊断疾病并帮助患者”,而不是“看片子”。AI让看片速度加快,医生能看更多扫描图像,接诊更多病人。医院赚了更多钱,病人增加了,因此反而需要更多放射科医生。


Lex:显而易见,NVIDIA的软件工程师数量将会增加,而不是减少。


黄仁勋:原因在于软件工程师的目标是“解决问题”,与“编码”任务相关但并不等同。我并不在乎他们写多少行代码。工作内容变了,但解决问题、团队协作、评估结果建立关联的核心目的没有变。这些都不会消失。


Lex:你认为全球程序员的数量可能会增加?


黄仁勋:现今对编程的定义仅仅是“明确规范、制定说明”,甚至构建软件架构。有多少人能描述规范让计算机去执行?我认为我们刚才从3000万增长到了大概10亿!未来的每一位木匠都将成为程序员,在AI辅助下木匠同时也是建筑师,会计师同时也是财务顾问。所有职业技艺和价值都得到极大提升。如果我是木匠或水管工,看到AI能提供的杠杆,我会彻底疯狂的。


Lex:目前的程序员正处于直觉理解如何利用自然语言与智能体沟通、设计最佳软件的最前沿。学习传统编程语言最佳实践和设计原则仍然具有价值。


黄仁勋:规范设定的艺术性取决于你试图解决的问题。当我制定公司战略时,我会以具体层级描述大体方向。但我会有意减少死板的规定,以便让43,000名优秀人才将其做得比我想象的更好。规范和架构定义的精细程度取决于我在和谁共事。


每个人必须学习在编码领域如何定位自己,编写规范本身就是一种编码。有时采取非常严谨规范的硬编码,有时减少规范与AI反复交流拓展创造力边界。关于规范设定艺术性的把控,正是编码的未来。


处理焦虑与拥抱AI的建议


Lex:跳出编码领域,很多人对白领工作的自动化产生巨大焦虑是合情合理的。面对变革性技术带来的动荡阵痛,需要怀有同理心。希望工具的演进能像在编程领域一样提高生产力消除枯燥,凸显人类的创造性。我最近在编程时从未感到如此快乐。但依然会有许多痛苦,该如何面对?


黄仁勋:我处理焦虑的方式是拆解问题:对于力所能及的事情理智分析并付诸行动。


如果我今天要在两个应届毕业生中做选择:一个对AI一无所知,另一个是使用AI的专家,我绝对会雇佣那个精通AI的人。会计、营销或律师也是如此。我建议每一位大学生、木匠、电工都应该去使用AI,看看它能如何改变目前的工作,提升自己。


Lex:农民、药剂师绝对都该使用AI。


黄仁勋:利用AI创新成为彻底改变行业的引领者,这是首要任务。这项技术会造成职业变动淘汰机械任务。如果工作内容仅限于这些死板任务,你确实面临颠覆;但学习如何利用AI来自动化这些任务作为杠杆至关重要。


Lex:聊天机器人版本最棒的地方在于,当你感到焦虑时可以通过交流拆解问题。比如“我为工作担忧,该如何提升技能?”直接问它,它会提供执行计划,是一个完美的务实生活教练。


黄仁勋:如果你不知道怎么使用AI,直接对它说:“我不知道怎么用,请演示给我看。”


Lex:没错。面对Excel你不能说“我不会用教教我”,但AI彻底消除了初学者第一次尝试新事物的初始摩擦力。就像我即将去台湾,所有去哪、做什么的问题都会立即得到解答。


黄仁勋:当你去台湾时,直接问AI:“Jensen在台湾最喜欢的餐厅是哪几家?”到时候我真的会告诉你答案是否准确。


Lex:你在那边可是大明星,未来在Computex或台湾GTC相遇将非常美妙。你认为关于人性、意识,是否有根本上非计算性的特质?无论芯片多强大都无法复制?


智能商品化与人性的力量


黄仁勋:紧张或任何情绪,我相信AI将能够识别并理解,但我并不认为我的芯片会真实“感受”到紧张。


Lex:焦虑、兴奋等情绪体现了人类的主观体验和卓越表现。


黄仁勋:两台计算机被提供完全相同背景信息时不会因为产生不同“感受”而呈现不同结果,这与人类面对相同境遇表现各异是不同的。


Lex:没错,那种主观性,我们感受到希望、恐惧、焦虑、坠入爱河、心碎和对死亡的恐惧。很难想象计算设备能做到这点,但规模化在智能领域能创造奇迹,我对未来惊喜持开放态度。


黄仁勋:剖析“智能(Intelligence)”非常重要。它并非神秘词汇,它涵盖感知、理解、推理和规划的功能循环,本质上就是智能所在。


Lex:智能并不完全等同于人类。


黄仁勋:区分两者非常重要。我不会过度美化智能,实际上我认为智能即将成为一种廉价的功能性商品。在我所处的领域里,身边环绕着许多比我更聪明的人,然而我在那个圈子里依然扮演核心角色。


他们比我受过更好的教育,去的学校比我好,专业钻研得更深。我手下有60位这样的顶尖“超人”。而不知何故,我正坐在中间统筹着他们。你得问问自己,洗碗机(注:打扫餐厅的自嘲)究竟有什么特质,能坐镇于这些超人中间?


这说明:人性的定义绝非由功能性的智能所限定。决定我们上限的是人生阅历、对痛苦的承受力、决心、品格、同理心和慷慨,这些才是真正的超人力量。


尽管智能即将成为普及商品,最重要的依然是品格。即便我在智力曲线上的位置低于周围的每一个人,也改变不了我是最成功者的事实。所以,不要让智能的商品化引发你的焦虑,真正应该被提升和赞美的是人性,你应该为此振奋。


Lex:AI将帮助我们更好赞美人类。让世界变得不可思议的永远是人类,AI只是让我们变得更强大的工具。


继任计划与知识的即时传递


Lex:确实如此。NVIDIA的巨大成功以及无数人的生活都依赖于你。和所有人一样终有一死,你会思考自己的终结吗?害怕死亡吗?


黄仁勋:我真的不想死,我过着很棒的生活。但我所经历的是人类历史上前所未有的体验。NVIDIA是最重要的科技公司之一。关于实际问题,我向来以直言不讳著称:我不相信传统的继任者计划。这并不是因为我不朽。


Lex:如果被继任规划的焦虑困扰,该怎么做?


黄仁勋:那就把问题拆解还原。如果你关心公司在你离开后的未来,今天最应该做的事,就是尽可能频繁且持续地向团队传递知识、见解和经验。这也是为何在团队面前不断对所有事物进行公开推演。我学到的任何新知在脑海停留绝不会超过一瞬间,甚至在完全掌握前,就指引别人去学习赋能他们。我所希冀的结果,是我能在工作中离世,瞬间在工作中离世,那样就不会有长期的痛苦了。


Lex:从粉丝角度看,鉴于你对文明的巨大积极影响,我希望你和NVIDIA继续前行。NVIDIA持续完成不可思议的工程成就,这是对人类伟大建设者和伟大工程的绝佳赞颂。


对未来的浪漫情怀:向太空发射AI意识


Lex:放眼未来10到100年的光景,是什么让你对人类的未来充满希望?


黄仁勋:我一直对人类的善良、同情心和能力充满信心,甚至信心超出了应有的程度。虽然偶尔会被人利用,但我始终认为人们内心想要帮助他人,绝大多数情况下事实证明我是对的。


当我基于当下的可能性进行技术推演时,让我感到无比希望。有太多我们想要解决的难题。


期待疾病的终结、污染的大幅减少都在我们这一生的触及范围内。面对这一切,你怎么可能不感到浪漫呢?生在这个时代令人兴奋!


很快,我会把一个专属的类人机器人送上太空飞船发射出去,它会在飞行中不断增强。等到时机成熟,我会将我生命中的大部分内容(收件箱、做过的每一件事、说过的每一句话)积累成我的意识AI,然后以光速发送出去,去追赶我的机器人。


Lex:噢,这太棒了!那里有太多引人入胜的科学谜题了。


黄仁勋:了解生物机器的奥秘指日可待,大概只需5年吧。


Lex:届时人类对理论物理学和意识的破解都将实现,这一切触手可及。Jensen,感谢你多年来为世界所做的一切。感谢你保持本真。期待未来在Taiwan见到你。非常感谢你今天的谈话。


黄仁勋:谢谢你,Lex。感谢你开创这种长篇深度访谈形式,你对知识的敬畏和对嘉宾的深入研究对所有人意义非凡,这对我意义重大。


Lex:感谢收听这次与Jensen Huang的对话。最后,让我以Alan Kay的话作为结束:“预测未来的最好方法就是去创造它。”

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: