扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
英伟达从濒临破产的显卡公司成长为AI时代计算霸主,核心在于黄仁勋基于GPU愿景的长期布局与快速迭代能力,最终迎来AI爆发的"运气"。 ## 1. 黄仁勋的创业基因与早期挫折 - 移民背景塑造强硬性格:9岁赴美遭遇校园霸凌,扫厕所经历培养抗压能力,乒乓球天赋展现竞争意识。 - 技术积累关键节点:AMD/LSI芯片设计经验结识Sun工程师,1992年三人创业时PC图形化浪潮(Windows 3.1三个月卖300万份)奠定市场基础。 - NV1致命失误:1995年产品堆砌技术却忽视兼容性,导致公司从100人裁员至40人,竞对3dfx曾考虑收购但放弃。 ## 2. 光速迭代与行业洗牌 - 生死时速的RIVA128:1997年用9个月开发周期(行业平均2年),128位内存实现30帧突破,4个月卖出100万张。 - 每六个月新品战略:三组并行开发架构,GeForce 3(1999年)首次定义GPU概念,2000年竞对3dfx破产时吸纳其106名工程师。 - 管理铁律:黄仁勋"批评式管理"驱动每周60-80小时工作强度,40位高管直接汇报保持扁平结构,2001年成为最快年收10亿美元的半导体公司。 ## 3. CUDA的长期赌注与AI爆发 - 超前布局并行计算:2006年推出CUDA时年下载量仅1.3万次,4.75亿美元研发投入致毛利率从45.6%降至35.4%,遭激进投资者质疑。 - 关键转折点:2012年AlexNet在ImageNet识别准确率超传统算法10%,12块GPU替代2000个CPU的计算能力验证GPU优势。 - 软件生态壁垒:2024年CUDA拥有500万开发者,AI推理性能10年提升1000倍中400倍来自算法优化,DGX-1定价达14.9万美元。 ## 4. 商业策略与行业范式转移 - 价值定价体系:GPU从RIVA 128的15美元涨至RTX 4070的600美元,利用视觉体验溢价突破半导体ASP下降魔咒。 - 计算范式革命:CPU串行计算受摩尔定律放缓制约,GPU并行架构适配大数据与AI需求,2023年数据中心业务2年内增长10倍至300亿美元/季度。 - 供应链护城河:1997年转投台积电建立"大致公平"关系,2019年70亿美元收购Mellanox获得NvLink服务器互联技术。
2026-04-18 09:09

英伟达简史:基于愿景的运气

本文来自微信公众号: XYY的读书笔记 ,作者:肖俨衍,原文标题:《【读书】【硬件篇】英伟达简史:基于愿景的运气》


前言&书籍:英伟达和黄仁勋无需介绍,只是由于黄似乎确实更专注于未来,不喜欢回顾过去,此前英伟达一直没有传记。这次趁着其登顶全球市值第一热度,出来两本相关书籍。看得出来,这两本书虽然通俗易懂,但相较于此前优秀的传记,在全面性和深度上都还欠缺点火候。但是读完两本书,依然可以梳理出英伟达崛起过程中一些关键脉络。


黄仁勋个人经历:从移民、扫厕所到创业


黄仁勋(Jensen Huang)于1963年2月出生于台湾,随着其父亲工作后来移居到了泰国。1973年,随着泰国内部政局不稳定,其父母将黄仁勋(9岁)送到美国华盛顿州舅舅家,当时他还不怎么会说英语(主要用闽南语和家人交流)。黄仁勋在美国第一个就读学校聚集不少问题子弟,而作为少数族群的黄仁勋自然也受到了校园霸凌,不过这恰好培养了黄好强,善于反击和作战的个性。在校学生当时被要求参与工作,黄仁勋的工作就是扫厕所,他后来经常用这段经历说明自己不怕艰辛和脏活。黄仁勋有很强乒乓球天赋,1970年代他加入当地一家乒乓球俱乐部接受专业训练,其15岁参加美国青少年乒乓球赛拿了第三名。17岁的黄仁勋选择就近就读俄勒冈州立大学,这所大学离其父母家只有90分钟车程,其选择了电气工程专业(当时这所大学还没有计算机专业)。在大学中,黄仁勋学会了电路设计,奠定了其后来职业生涯道路,并且遇到了自己未来的妻子Lori Mills。当时电气工程专业大约有250名学生,其中仅有3名女生,黄仁勋是班上年龄最小的,未来吸引Lori注意力,黄会主动打电话约她一起写作业(善于主动出击,且利用自己优势)。


AMD和LSI职业生涯。1984年,黄从大学毕业后首先面试了德州仪器,结果不好。后来他又面试了AMD和LSI logic,并且拿到了两家公司的offer,他最终选择了AMD。此外,他还利用周末和晚上读斯坦福大学电气工程的硕士,花了8年终于拿到了硕士学位,对此,黄仁勋解释说自己有长期思维,他可能对于一些事情很不耐心,但是对于其他事情极具耐心。黄仁勋在AMD工作是设计芯片(当时还是手工),他在AMD工作了两年,觉得有点无聊,正好碰上一个同事跳槽LSI logic,于是他跟着也跳槽了。LSI当时开发了一款可以设计芯片的工具软件(EDA雏形),凭借一直专注工作,黄仁勋开始精通集成电路模拟软件SPICE,他通过命令可以输入元器件,并且帮助LSI客户们处理各种在当时看起来不可能的难题。黄仁勋服务客户中间就包括Sun Microsystem,结识了后者两位工程师Curties Priem和Chris Malachowsky,而这两位成为黄日后创立英伟达的合伙人。


Curties Priem经历。Priem可以说是一位类似苹果创始人之一沃兹尼亚克一样的技术天才,他从小就自学编程并且自己写游戏。大学毕业后,Priem拒绝了通用汽车的全职奖学金(研究生),选择加入硅谷创业公司Vermont Microsystem(受当时类似苹果ipo浪潮影响),他的第一个项目就是帮助IBM PC打造显卡(Windows当年就是给IBM PC打造操作系统,Intel是打造CPU),Priem作为公司唯一懂显卡技术的人,瞬间从新员工变成了项目组长。Priem开发的显卡能够渲染分辨率达到640*480的256色图案,且可以独立于CPU工作,是一款出色产品。然而,Vermont这家公司却不是苹果,老板不愿意跟员工分享股权,Prime选择在显卡发货日离开公司,并且加入了当时基于工作站崛起的Sun Mircosystem,工作也是开发显卡。然而,当时其在Sun的领导却坚持公司的SPARC工作站不需要单独显卡,集成在CPU里面就可以了。Priem只能秘密开发自己的产品,而Chris Malachowsky就此时成为他的帮手。Priem构思了显卡需要的单元,此时他们找到了黄仁勋所在LSI合作来完成产品,Priem构思显卡架构,Chris负责设计,而黄仁勋则负责推动工具成产,三人合作融洽。这款产品是GX graphics,定价2000美元,作为附加选项选配,其在历史上第一次做到屏幕切换画面快于人脑反应速度。其显卡最好的应用场景确实Priem利用业余时间开发的一款游戏《Aviator》,其还允许用户通过局域网联机打游戏,后来GX显卡成为工作站的标配。不过,后来Sun的大公司病就起作用了,CPU集成显卡的路线再次取胜,Priem在公司干不下去了,由此他和Chris一起找黄仁勋想拉着后者创业,主要想法是基于PC打造显卡(之前是基于工作站),虽然他们都不懂PC。


英伟达从失败到成功


三人行创业。三人商量创业想法时候是1992年,当时Windows 3.1于1992年4月发布爆火,前三个月卖出300万份,真正开启了PC的GUI时代(显卡真正用武之地),并且搭配了Windows media player等多媒体功能。此外,当时PC主机主板开始采用PCI主线,允许主板上其他硬件和CPU用更快速度沟通。这些基础条件都是英伟达能够成功不可忽视的背景条件。黄仁勋最开始对创业感到犹豫,与其他两位被排挤的合伙人不同,他在LSI的工作蒸蒸日上,并且被老板重用。不过最终他认为显卡赛道有希望做到5000万美元的年营收,他决定参与到创业中来。Sun差点成为公司第一个客户,当时其在开发Java,而希望Priem帮他们开发一个芯片可以加速Java运行。不过最终Priem拒绝了,他决定全力开拓自己感兴趣方向。公司创业地点在Priem的别墅卧室里(他把物品都搬到车库去了,所以英伟达不是在车库里面发家),Priem和Chris负责产品和技术,黄仁勋负责其他,他被冠以CEO称号。组建过程中,又有几个来自Sun的工程师加入。Nvidia这个名字词源来自envy(嫉妒),其隐含意思希望英伟达有一天能够打造出让全世界嫉妒的产品。英伟达所在的显卡(初期叫图形加速卡)赛道当时竞争十分激烈,至少有35家公司做类似产品,很多行业专家都劝黄仁勋不要进军这个赛道。融资时候,黄仁勋的发挥可以说很烂,连基础的产品定位问题都回答不好,不过红杉资本还是选择投了,因为LSI老板向红杉资本老板Valentine推荐了黄仁勋。


NV1失败让公司濒临破产。第一轮融资成功后,英伟达团队扩展到20人。Priem开始专注于第一代产品NV1的研发,当时如果靠硬件加速浮点运算(显卡需要)价格很高,4M内存售价高达50美元,Priem用软件方法解决了图像渲染问题,好处是成本很低,坏处是兼容性不足,没有针对其标准开发的游戏将变得又慢又差。Priem却自信的认为当时行业分散没有标准,英伟达的标准将成为行业标准。Priem还想优化声音效果,在NV1开发了类似声卡的功能。他们选择了欧洲的SGS进行代工(而不是红杉资本推荐的台积电,后来才转向台积电),原因是SGS能够提供更好合作条款,两家同意SGS以100万美元代价获得NV1中端产品贴牌出售资格。这100万美元成为英伟达整个软件团队收入来源。1995年,英伟达还和日本主机游戏厂商Sega签订合约为后者游戏主机提供定制化显卡NV2,Sega还购买英伟达500万美元优先股。NV1整个开发周期花了1500万美元,几乎是英伟达所有的资金,其1995年5月发布并且很快卖出了10万个,主要得益于捆绑销售《VR战士》需求,当时黄仁勋及公司都很有信心。然而,1996年一季度后销量开始疲软,因为游戏玩家发现NV1没有VGA兼容,在其他游戏体验不佳。NV1和Windows兼容性也有问题,经常会蓝屏死机。事后证明,NV1很多功能都只是Priem一厢情愿,技术的堆砌并不能确保产品成功,核心还是在产品定位上出了问题。1996年Sega也宣布终止了和英伟达的合作,不过根据合约公司依然能够得到100万美元。NV1失败让英伟达濒临破产,公司员工从100裁员到40。


主要竞对3dfx,英伟达没有收购价值。英伟达当时主要竞对之一是3dfx,其成立于1994年,主要创始团队来自Silicon Graphics(专供图像工作站),其产品Voodoo Graphic号称是唯一能够在PC平台提供工作站级别影像效果的显卡产品,其产品定位清晰,就是将工作站能力下放到PC,售价299美元,随着越来越多3D游戏产品(尤其是《Quake》)推出,其产品获得了成功,3dfx公司营收从1996年400万美元,提升到1997年4400万,到1998年达到2亿美元,并且推出了二代产品。3dfx高管知道英伟达在NV1产品失败后陷入困境,并且考虑是否收购英伟达,主要吸引力是英伟达旗下优秀的工程师。最终他们认为英伟达的破产在所难免,他们可以等到破产后再挖人即可。


孤注一掷RIVA128成功。英伟达银行账户只剩300万美元,公司只能运营9个月了,黄仁勋准备在NV3上孤注一掷。1996年,微软发布了图形渲染标准Direct3D,很快开发者们就抛弃了此前小厂们(包括英伟达)推出的各种标准。针对NV3(后来改名RIVA128),Priem希望利用128位内存打造创纪录的速度体验,其显卡尺寸将比此前所有产品都大,整块芯片上有350万个晶体管。为了缩短测试时间(以年维度,而英伟达只能活9个月),黄仁勋拍板100万美元购买一台仿真机器,其可以帮助公司跳过昂贵的原型制造环节,直接依据数据草图进行制造。Chris等工程师想办法基于NV1技术基础,并且增加诸多例如反向渲染等新功能,更好数学计算能力,这次英伟达产品对VGA等过往标准拥有很好兼容能力。1997年,RIVA3正式流片,黄仁勋觉得成功几率五五开。成品试验结果表现完美,首次实现了30帧的运动效果,并且获得了很高跑分结果,其成为PC端最快的3D显卡,包括3dfx在内的竞争对手都对这款产品效果感到震惊。RIVA128发布后4个月发货量达到100万,并且拿到20%市场份额,英伟达终于推出一款技术优势且被市场接受的产品。1997年四季度英伟达终于实现了140万美元利润。RIVA128推出后被发现在烟和云渲染效果有瑕疵,黄仁勋知道了大怒,他认为英伟达产品必须没有弱点。1998年RIVA TNT系列面世,改正了缺点,且其在《雷神之锤3》等游戏上表现出色,有1万美元计算机才有的效果,每秒可以达到60-70帧,英伟达的品牌在C端开始积累。


光速准则驱动英伟达前进


唯快不破,六个月推出一款新产品。1998年时候,当时仍有40多家显卡公司,黄仁勋预言未来5年将只剩下3家,而英伟达将成为三分之一。黄仁勋在公司内部推行光速原则,其一方面强调快速迭代,另外一方面强调物理极限(光速不可超越)。当时主流的显卡开发从概念到成品需要2年,而英伟达的RIVA128只用了9个月,为了提速,黄仁勋要求在开发芯片同时开发驱动软件。英伟达不依靠主板或者PC厂商分发驱动程序(基于产品更新周期),而是自己每个月提交更新。基于18个月的典型芯片开发周期,英伟达创造性将芯片卡法分为三组,第一组开发基础新架构,另外两组则基于这个新架构开发更快的衍生版本,这个英伟达可以每六个月推出一个新产品,显著领先于行业。英伟达深度践行软件仿真(黄仁勋重金购买仿真机器开始),尽量减少硬件测试环境,进一步加速了迭代周期。最后,英伟达开始特别强调兼容过往版本,这是产品成功前提(站在巨人肩膀上,而不是自己另起炉灶)。1999年,英伟达推出GeForce系列显卡,其对手正是3dfx的Voodoo显卡,其打在NV10驱动,每秒能够渲染1000万个三角形。GeForce系列还创新性将显卡定义为GPU,原创定义一个新赛道,自己成为领头羊。在新科技赛道崛起过程中,迭代速度是取胜关键,英伟达6个月的迭代周期使得其产品性能很快赶超3dfx,2000年左右后者宣告破产。


Jensen Style=英伟达Style。英伟达文化就是黄仁勋的风格,黄仁勋极度勤奋,其工作时间是从早上9点到午夜,他的很多下属也被迫保持类似工作时间,早期员工每周工作60-80小时都很正常,黄仁勋总是说我们离破产只有30天,焦虑和恐惧或许是他勤奋工作重要动力之一。RIVA128发布几个月后,Intel刚发布了竞品i740,其拥有8MB的缓存,比英伟达产品大一倍,这使得英伟达员工不得不更勤奋工作。事后证明i740也犯了NV1类似错误,他们采用Intel独特的渲染方式(巨头的傲慢?),导致兼容性有很大问题,在很多游戏效果不佳。总结黄仁勋的管理风格,有几点值得一提:


  1. 批评式管理。黄仁勋风格很彪悍,经常公开批评下属(发脾气),黄将自己的管理风格称为批评式管理,他说他每天起来照镜子都对自己说你很糟糕。受不了这种风格的员工肯定在英伟达呆不久,不够黄可能更多是对事不对人,其这种态度背后更多是push员工把事情做对做好。


  2. 扁平式管理。2010年时候,有40多位高管直接向黄汇报,随着公司规模增加很多人提议他雇佣一位COO帮他处理具体事务,黄表示反对。他认为高管群体他们是各自领域专家,且应该有自驱力,不需要管理,重要是保持信息互通就可以。


  3. 以事情为中心。黄仁勋会给每一个新项目指定一位负责人。其要求下属对其汇报工作仅仅写最重要的五件事,为了方便搜索,黄要求他们将加入标签。下属们发现黄回信速度极快,周五晚上12点发,他可能1205就回了,所以大家都周日给他发(保证自己过个周日)。黄仁勋不喜欢PPT,他喜欢在白板上讨论问题,所以他每到一个地方,下属们都要保证会议室有白板,甚至是黄个人喜欢的那款(官僚主义无处不在)。


  4. 最重要的是取胜。黄仁勋绝对是好胜欲极强的人,他曾经和朋友下棋中败北,必须在自己擅长其他领域赢回来。在和3dfx等竞争中,黄被对手渲染成邪恶的化身,他挖角员工,窃取创意,操纵测评者(刷分),甚至在竞对陷入困境时候落井下石。然而,商场如战场,公司CEO最重要任务无疑是带队打胜仗,而只有持续处于扩张状态时候,always day 1,员工利益才和公司利益始终一致,才能顾尽量避免组织熵增,大公司病。


不断挖人,积累优秀人才。Jensen不是技术大牛,但是其懂技术,且拥有技术信仰和愿景。他经常参加一些行业顶尖学术会议,目的就是结识优秀技术人才,并且挖到公司来。3dfx破产时候,英伟达提出7000万美元收购特定资产,其从3dfx挖来106位优秀工程师,并且给他们加薪20%,提供期权等待遇。2002年,位于Alabama的3Dlabs宣布关闭,英伟达直接在当地设立办公室来吸引人才。2005年,硅谷图形公司因为无法和英伟达抗衡从纽交所摘牌,英伟达吸纳了众多硅谷图形的员工。担任斯坦福大学计算机系主任的Bill Dally在2003年就看到了英伟达芯片潜力,黄仁勋主动找上门邀请他加入英伟达,前者最开始还有顾虑,黄拿出一张Dally名字的支票,后者开始担任英伟达顾问,后来全职加入公司至今仍然是英伟达首席科学家,Dally及其团队后来成为CUDA项目核心开发力量。挖人的另一面是留人,英伟达留人核心就是股票,并且依据员工贡献发放,2024年英伟达员工流失率是3%,而行业平均是13%。


和台积电长期合作关系。1997年,SGS Thomson代工英伟达旗舰产品RIVA128出现了良率问题,其估计仅能交付英伟达订单量的一半。这使得英伟达不得不寻找另一个代工伙伴。早在1993年融资时候,红杉资本就推荐过台积电,但是黄仁勋最开始和台积电联系没有回应。1996年他给台积电CEO张忠谋写信,这次张忠谋很快给与回复,俩人在硅谷见面,黄给张介绍了英伟达的愿景,很快双方就建立了合作关系,两位CEO也很快建立身后私人关系,到1998年台积电就成为英伟达核心供应商(也一直是台积电前五大客户),当时英伟达正好发布核心产品RIVA 128ZX,其对手是来自Intel的i740,英伟达产品性能更强,售价32美元,比i740高4美元。不过此次台积电代工出现了芯片污染,导致良率降低。Chris建议把芯片拿回来自己手动测试芯片好坏,很快英伟达就单独划出一栋楼,并且从外部招募了几百外包员工来加速测试过程。黄仁勋将和类似台积电这样重要合作伙伴关系定义为“大致公平”,其并不是每次都是完全公平,而是有起起落落,但是长期来看是公平的。


英伟达IPO前遭遇困境,赢得微软订单。随着RIVA系列遇到产能问题,英伟达营收从1998年一季度2800万美元下滑到二季度1200万美元,从盈利100万到亏损970万美元。此时英伟达本来准备IPO,由于突然遭遇变故,IPO不得不暂停。面对财务困境,黄仁勋找三位大客户寻求过桥贷款1100万美元,这三位客户相信英伟达产品和技术,过桥贷款可以在IPO时候以9折价格转换成为股票。英伟达最终于1999年1月IPO,募资4200万美元,首日股价上涨64%到19.69美元,公司市值达到6.3亿美元。公司管理层们开玩笑说如果股价涨到100美元,黄仁勋同意左耳打耳洞,Priem则同意做一个英伟达logo的发型。1999年正值美股dot-com泡沫,这一天不久后就到来了。随着GeForce系列显卡推出,英伟达开始给每个潜在客户免费送卡给他们体验,很快他们就感受到了英伟达显卡性能优势。1999年,微软准备推出游戏主机Xbox,借助此前和微软合作关系,经过一轮来回,英伟达最终成为Xbox的显卡提供商,微软将提前支付2亿美元覆盖研发费用,随着消息公布,英伟达股价飙升到100美元以上。1999年,英伟达营收达到1.6亿美元,而当年微软营收是200亿,苹果是61亿,亚马逊是16亿。


投资者的质疑。正当英伟达高奏凯歌的时候,其往日对手3dfx却因为跟不上时代而在2000年申请破产,其显示了科技企业竞争残酷性,不进则退,英伟达收购其部分专利和招募了100多名员工。谁能保证英伟达不成为下一个3dfx?2000年英伟达进行再次募资的时候,黄仁勋给投资者路演时候就遭遇了类似的质疑,我们此前投资了40家显卡公司都倒闭了,为何英伟达不一样?投资者认为Intel最终会基于CPU霸主地位,赢得显卡战斗。投资者唯一关注到的可能是黄仁勋与众不同,2000年他们依然成功募资3.8亿美元(赶在泡沫破裂之前)。


赢得苹果订单。英伟达历史上并未给苹果供应显卡,主要是因为其一直生产Intel兼容的显卡。2000年初,英伟达获得了iMac G4一笔小订单,这个系列产品是乔布斯回归苹果后拳头产品。当时英伟达的显卡demo视频主要是游戏内容,然而随着显卡性能越来越强,游戏内容开始不够用了,他们想到用3D动画来展示性能。当时Pixar的动画电影每一秒钟需要75个小时计算机生成,而英伟达GeForce 3可以很好模拟类似效果。唯一问题是版权,当时Pixar负责人John拒绝了英伟达的版权请求。英伟达两位工程师直接找到了乔布斯,他们先展示一段Pixar风格类似3D动画,乔布斯说看起来不错。然后,两位工程师开始点击画面,并且不断旋转视图,显然这是一段3D建模的视频,乔布斯被实时互动性惊呆了。乔布斯当下拍板iMac G4将GeForce 3作为选配提供。乔布斯还提议英伟达应该关注移动市场(笔记本),因为ATI已经开始领先了。英伟达两位工程师又驳斥了乔布斯的建议,因为他们向乔布斯解释了英伟达不需要为笔记本单独开发芯片,因为其芯片调整一下就可以适配笔记本。乔布斯的回答是:“Okay”。后来英伟达在苹果笔记本订单占比从0提升到了85%。


Priem离开英伟达。Priem在英伟达命运从NV1失败后就有点动摇了,其仍然希望决定公司技术发展方向,但是黄仁勋希望客户不要退货。Priem是技术天才,但显然不太擅长人际交往。黄提拔了David Kirk担任下一代产品技术架构负责人(和Priem平级),Priem和黄仁勋的关系开始显著恶化,结果是Priem被降职,实际上1998年以后他与英伟达的成功就没多少关系了。2003年,Priem正式宣布离开英伟达,并且开始抛售手中股票(2004-2006),他在奥克兰购买一处价值高达600万美元牧场,并且购买了私人飞机。他的股份如果持有至今将价值1000亿美元,不过Priem说我计划有生之年捐赠5亿美元,如果是1000亿,我真不知道应该怎么捐赠(花钱比赚钱难,【读书】美国“儒商”洛克菲勒:首富=首善)。


避免创新者窘境,不断涨价。黄仁勋是《创新者窘境》的忠实观众,他自然不会允许有人从低端市场打到英伟达,其结果是英伟达推出了4-5个不同层级产品的产品矩阵,分别覆盖高中低端市场。早期英伟达显卡产品售价不高,RIVA 128时候只有15美元,RIVA 128ZX是32美元,GeForce 256时候是65美元(1999年),正是这代产品英伟达首次提出了GPU概念,不过即使GPU拥有更多晶体管,其价格都显著低于Intel CPU 500美元以上(2000年)。而随着GPU概念推出,其隐含意思是GPU和CPU是一个级别的产品,英伟达GPU基于持续升级性能不断涨价,两者售价也开始不断缩窄(最新英伟达Nvidia GeForce RTX 4070售价600美元)。英伟达认为只要用户能够从屏幕中看到更好的、不同的效果,他们就会愿意付钱(这一点有意思,CPU这类性能再强,其最多也就让用户觉得快一点(有点理性)。但是GPU显卡可以激发人类感性感觉,这似乎对于其不断提价有很大帮助)。即使后来其提供其他应用场景GPU,英伟达的说法都是我们专注于提供最好服务,因此不议价。英伟达是少数ASP能够持续增长的半导体公司,很多公司ASP都是不断下跌的。2001年,英伟达在GeForce 3中加入了可编程着色功能,给开发者开放更底层编辑功能,获得了很大成功。2001年第三季度英伟达营收3.7亿美元,同比增长86%,年化收入超过10亿美元,成为美国最快达到这个成就的半导体公司,其股价相对于IPO也上涨了20倍,市值高点达到200亿美元(下一次达到这个数字是14年后)。


第一次股价下跌90%。2001年夏天到2002年秋天,英伟达股价下跌了90%,这里除了dot-com泡沫破裂市场原因,还有自身原因。其一是NV30开发失误,英伟达拒绝接受微软更新Direct3D API(有强制条款),只能在没有官方手册背景下开发下一代产品。此外,软件和硬件团队也开始出现沟通问题,硬件团队私自将雾效着色器移除,这让软件团队震惊,因为这个功能用户不少。工程师对比后,NV30在很多性能上都被竞对ATI的Radeon 9700 PRO超过,后者还和微软紧密合作,NV30发布不得不延期。最后,为了加强散热,NV30风扇噪音异常大,因为不少用户抗议,后来英伟达营销团队还出了个自嘲视频。ATI最终将自己的产品定价和英伟达一样399美元,如果其攻击性更强一些,定价更激进一些,说不定英伟达就危险了。黄仁勋认为公司当时问题部分可能来自3dfx等外来人才过快进入公司,导致不同团队沟通不畅(挖人太激进后遗症),他很快修好了和微软关系,并且确保公司不再犯类似错误。另一方面,当时英伟达还遭遇了SEC调查,当时正值Worldcom、安然等财务造假,英伟达需要重新申报过去3年的财务报表,CFO被迫离职。不过事后看来,这大概率只是个失误,因为更新后报表显示,英伟达过去3年盈利状况好于之前报告。


基于愿景的运气,AI时代卖水人


缔造CUDA。相比于CPU是个通用计算芯片,能够处理串行各种复杂任务。GPU则是更偏专用,其擅长于并行处理简单任务。虽然CPU在上半场称雄,但是GPU代表计算范式事后证明不亚于CPU。CUDA的缔造者John Nickolls之前创立过几家并行计算公司不太成功,早在2003年就给黄仁勋写信阐述他认为Intel长期在半导体的霸主地位即将终结,其核心理论是登纳德缩放定律即将在2005年终结,这使得CPU的性能提升将减缓(串行计算),这时并行计算的春天就来了,他后来加入了英伟达。另一方面,早在2002年,就有科学家基于GeForce的可编程着色器功能改造GPU进行矩阵计算,这种改造需要较高的技术门槛,科学家们还给这类用途的GPU命名为GPGPU(通用目的的GPU)。黄仁勋很快就意识到GPGPU有希望为英伟达打开新的发展空间,当时英伟达正在开发NV50系列,其底层编程语言将从英伟达特定的Cg转换为行业通用C语言,从而极大降低GPU的编程门槛,英伟达将这套编程基础称为CUDA(Compute Unified Device Architecture),其不仅服务图像编程者,也服务科学家等其他领域。为了进一步降低门槛,黄仁勋主导英伟达全系列GPU产品兼容CUDA,即使专门为游戏玩家服务的GeForce系列,这样用户可以以相对合理价格获得CUDA计算能力。2006年11月,英伟达正式推出G80系列显卡,CUDA也同期推出(免费,但仅限于英伟达硬件)。为了推广CUDA,英伟达开始给大学捐设备,并且其首席科学家David Kirk还在大学开设第一门并行计算的专业课程,并且编写了第一本平行计算的教科书。


投资者质疑CUDA投资价值。CUDA早期成绩可以说令人失望,到2007年期下载量仅为1.3万次,在数亿GeForce用户中渗透率不到1%。相比于GeForce系列常规1年开发周期,G80花了4年,且相应的CUDA投资高达4.75亿美元,占了当时英伟达三分之一所有研发费用。英伟达对GPGPU场景持续投资使得英伟达毛利率显著下降,从2008年45.6%下降到2010年35.4%,投资者开始持续质疑CUDA巨额投资的意义。此外随着2008年金融危机爆发,高端显卡需求遭遇显著影响,英伟达又遇到“凸点门”(错误焊接)导致玩家流失到竞争对手,一系列内忧外患导致英伟达的股价再次下跌了90%。2009年CUDA下载量30万,到2012年下降到10万。英伟达瞄准科学计算领域投入了几十亿美元,其股价十多年来没什么起色,这看起来是一家平淡无奇,毫无进展的公司。2013年,英伟达董事会收到了激进投资者Starboard的信函,其甚至对于黄仁勋是否应该继续担任公司CEO合理性提出异议。当时英伟达还准备斥资3.8亿美元收购调制解调器厂商Icera,Starboard对此提出严厉批评,并且要求黄仁勋集中精力,黄采纳了他们建议放弃了调制解调器市场,并且开展了股票回购,但是他从未考虑放弃CUDA。然而,往往最低点也是最好的时候,因为深度学习引领的AI革命马上就要突破了。


AI革命开启,英伟达持续做优化。生命科学在AI爆发之前也是并行计算应用场景之一,英伟达积极和科学家配合,其核心策略之一是借助CUDA将GPGPU产品定价更高,获取溢价(现如今AI计算中心定价高达数万美元),然而早期科学家们反对这种定价策略,坚持用普通游戏显卡计算。AI产业缘起于上世纪60年代,中间经历几轮来回,其中80年代Hinton发明了反向传播又推动神经网络往前迈进一步,下一波就到2010年左右的深度学习革命(当时神经网络已经被行业鄙视,所以必须换个称呼)。尤其是2012年左右Hiton及其学生Alex Krizhevsky,Ilya Sutskever打造的AlexNet神经网络在李飞飞主导的图片大数据集ImageNet上显著超越其他算法的表现(准确率高10个点,Scaling Law起点),AlexNet正是基于GPU训练的神经网络。2012nian,来自Google的Andrew Ng基于2000个CPU超算打造了一个基于1000万张Youtube图片训练的神经网络,其能够自动准确识别猫的图片。当他用英伟达CUDA优化,其计算量可以用12个GPU替代计算(从2000到12)。2013年,英伟达的AI专家卡坦扎罗观察到了AI产业变化并且在英伟达寻求资源支持,最开始他遭遇了上级否定(大公司阻力)。同年3月GTC大会上,黄仁勋讲了气象建模,却只字未提神经网络。卡坦扎罗决定直接向黄仁勋汇报,黄立即意识到AI潜力,并且花了一整个周末学习行业进展,他意识到多年CUDA基于愿景的投入可能找到了Killer App,到周一早上,英伟达已经转型成一家AI芯片公司(有点夸张)。针对AI计算特定需求,英伟达进行了一系列优化,比如神经网络对计算精度要求不高,其将传统32位精度下降到16位。打造了专用的矩阵计算引擎Tensor Cores,相对于普通GPU,其训练模型效率高3倍。2014年GTC大会上,黄仁勋登台首次将GPU和AI联系在一起。2014年末,Google开启打造全球最顶尖并行计算机“麦克卡车项目”,并且购买4万个英伟达GPU,投入资金1.3亿美元,这是英伟达有史以来最大的订单。2019年英伟达以70亿美元收购以色列的Mellanox,其技术成为后来NvLink(服务器之间高速通信)技术基础,也是英伟达重要壁垒之一。


为何不用其他GPU训练模型?2017年CUDA软件包下载量达到270万,同比增长3倍(Alpha Go火了后),是2012年15倍,到2017年斯坦福大学最受欢迎的课程已经变成了CS229,深度学习导论。当时部分CUDA需求来自加密货币挖矿(英伟达对这部分始终保持沉默,还被SEC罚款,不过后来挖矿转移到ASIC)。随着英伟达CUDA崛起,Intel和AMD等都基于开源替代OpenCL等,为何没有人用?通常说法是CUDA成为标准,要迁移很难。实际上,开发者可能仅需几行代码就可以完成迁移。还有一种说法是企业采购采取保守策略,购买英伟达硬件不出错。实际上,英伟达胜出核心原因不是因为硬件性能,而是软件优秀。2012到22年,英伟达在AI推理性能上实现了1000倍加速,其中仅有2.5倍来自晶体管增加,高达400倍归功于英伟达的数学工具集。今天,CUDA有500万开发者,600个AI模型,300个软件库,以及3700个CUDA相关的应用,有5亿CUDA兼容的英伟达GPU。而如今,英伟达的顶端游戏显卡定价达到2000美元,而AI超算DGX-1定价达到14.9万美元,下一代产品GB200包含72个GPU,定价超过三百万美元。


结语:10倍突变,市值第一


10倍突变。2022年年底ChatGPT爆火掀起了AI产业真正拐点,作为AI时代唯一“军火商”,英伟达芯片一片难求。2023Q2英伟达实现营收110亿美元,显著超越市场预期7亿美元。第二天英伟达股票上涨24%,市值增长1800亿美元。2024年1月,英伟达以3.3万亿美元市值登顶全球市值第一。从财务指标来看,其数据中心业务营收从2023年每个季度约30亿美元,在25年Q3(财年)超过了300亿美元,2年实现了10倍突变,且仍然保持较快季度环比增速。2年时间,英伟达完全实现了从游戏显卡公司到并行计算王者的蜕变,而从2006年推出CUDA开始,英伟达和黄仁勋已经布局了接近20年。2022年,面对美国对中国芯片制裁,黄仁勋表示:“如果他们不能从我们这里买,他们会自己制造”。(放眼望去,现如今全球最重要的四大半导体公司英伟达,Intel,AMD,台积电的CEO都是华人,你很难想象美国人能够组织咱们攻克半导体)面对AI风险论,黄仁勋嗤之以鼻,他不是科幻小说的粉丝,他认为技术发展只会让人类有更多自由做自己想做的事情,显然是积极的。从1993年至今,黄仁勋持续担任英伟达CEO已经32年,其仅次于伯克希尔的巴菲特(即将卸任),Blackstone的苏世民等是美股第四长任期的CEO。黄仁勋已经62岁,黄仁勋塑造了英伟达,他可能还能干几十年,也有可能明天发生意外,而其工作风格显然具有不可复制性,黄仁勋之后的英伟达会如何?不可否认的是,今日英伟达已经显著和20年前唯快不破时期不同,CUDA等壁垒已经根深蒂固,不容易攻破,即使实现类似从乔布斯到库克的转变,只要计算范式不变(比如量子计算?),英伟达大概率仍然可以统治行业很久。



黄氏定律&计算范式变革。客观来说,Intel并不是败在管理层,什么大公司病之类的,而是计算范式转变——英伟达来自游戏的显卡营收每年也就接近100亿美元,而Intel来自传统CPU收入应该至少300亿美元。而GPU本身就是代表并行计算,将其用于AI等非游戏领域是一种自然延伸,并不算英伟达自己颠覆了自己(英伟达也不是万能,他2010年代布局手机芯片就几乎失败了)。CPU擅长处理串行复杂问题,其是计算机时代能够成立的重要前提,而摩尔定律(Intel创始人)则是CPU主导计算时代核心准则。然而,随着摩尔定律越来越接近物理极限,CPU计算性能增长减缓。这就给GPU代表并行计算带来发展机遇,其擅长于处理并行的简单问题,适配大数据发展趋势。如果用人类打比方,CPU更像人类系统2,其等同于批判性思考,理性推理,逻辑推理,计算等工作。而GPU则更像人类系统1,其等同于人类视觉等基础感官能力,以及直觉瞬间思考。计算机发展缘起应该和人类是互补关系,主要工作是从事一些人类不擅长的事情(系统2天生懒惰,人类大部分时间用系统1思考)。并行计算时代似乎让计算机更像人类思考,人工智能自然就是类似的应用。


巨大的成功=多一点实力+巨大的运气。以上解释看起来很有道理,文章中也有科学家有类似的看法,但这个判断在20-30年前是否容易做出?恐怕很难,相信黄仁勋布局CUDA等也不是准确基于类似判断,更多是基于愿景,黄既懂商业,又懂技术(多一点的实力),他相信GPU可以有更多应用场景,而科学计算很有意义,所以他不顾外界反对持续投资CUDA。但实际上其遇到AI爆发以至于带来10倍突变(也等了10年),以至于英伟达市值登顶全球,那更多或许应该归功为运气。正如洛克菲勒最开始布局石油主要应用场景是煤油用来电灯,谁知道后来汽车、飞机、内燃机等会使得石油应用场景大增?读罢英伟达历史,其NV1开发失败公司濒临破产还能够凭借RIVA128重振旗鼓,能够唯快不破持续迭代领先行业,基于视觉感官优势(相对CPU物理计算)打造出不断涨价的价值定价体系,这些或许和基于愿景的运气一样同等值得敬佩。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜