2026-06-29 13:07

收购仅一年即“决裂”,创始人贾扬清出走英伟达:黄仁勋不满运营效果,20亿美金的AI Infra 突围为何折戟?

author_path AI前线
头图

本文来自微信公众号: AI前线 ,作者:青和,原文标题:《收购仅一年即“决裂”!创始人贾扬清出走英伟达:黄仁勋不满运营效果,20 亿美金的 AI Infra 突围为何折戟?》


据半导体调研机构SemiAnalysis爆料,LeptonAI的创始人兼CEO、英伟达系统软件副总裁贾扬清,已从英伟达离职。距离黄仁勋豪掷7亿美元,收购这家仅有20人的创业团队,才刚刚过去一年。


更耐人寻味的是,就在本月初,GPU云服务商Hyperbolic宣布聘请贾扬清担任公司顾问。Hyperbolic在公告中称,贾扬清将为其在AI系统、云基础设施、GPU marketplace、多云编排和GPU利用率提升等方向提供经验支持。这在业务层,与其在英伟达负责的DGX Lepton平台高度相似。



笔者对此向贾扬清本人求证离职消息,截止发稿前暂无正面回应。目前贾扬清社交平台x、领英的就职信息仍停留在英伟达阶段。


对于离职原因,SemiAnalysis直言,DGX Lepton的运营效果不及黄仁勋预期;但更深层的原因还涉及,黄仁勋与贾扬清在项目开源承诺的分歧、产品落地执行力等层面的问题。



Caffe、PyTorch、ONNX的缔造者,上一代AI框架公认的奠基人。连人带团队7亿美金被英伟达收编,原本是一段软硬融合的佳话,为何短短一年就分道扬镳?


细究下来,在这个戏剧性的转折背后,还藏着两个强烈的行业信号:


第一,GPU可以靠稀缺性卖断货,但AI Infra却无法实现垄断。当英伟达作为硬件霸主试图向上层软件扩张时,遇到的阻力,比造GPU还大。


第二,当AI已经能自己写代码、管集群,那些以“降低工程门槛”为卖点的中间件平台,正在面临被直接被取代的价值危机。


贾扬清交付的筹码


2025年4月,英伟达正式完成收购,随即将LeptonAI更名为DGX Cloud Lepton,并于当年6月重新对外发布。


表面上看,这是一次软件能力的补强。但如果联系英伟达当时的战略处境,就会发现这笔收购的野心远不止于此。加上此前收购的AI基础设施编排和工作负载管理平台Run:ai约12亿美元,英伟达先后在GPU云软件栈上的总投入将近20亿美元。


过去两年,英伟达是AI时代最大的“卖铲人”,但这还不够。黄仁勋不仅想让大家买它的卡、用它的CUDA、接它的软件栈,还希望把全球GPU资源变成一个统一入口。


简单来说,就是从AWS、Azure、阿里这些客户手里再分一杯羹:在云厂商之上,再建一层属于自己的软件平台。让开发者不再到处问“哪里还有H100”,而是直接在英伟达的平台上找卡、租卡、部署模型。


而贾扬清,就是这个计划最完美的代言人。



对华人开发者来说,贾扬清曾一度被视为AI领域的大神,并长期推崇践行开源精神。


2013年,还在UC Berkeley读博士的他,写出了Caffe——第一个被工业界大规模采用的深度学习框架。它奠定了"模型即配置文件"的工程范式,让深度学习第一次真正走出了实验室。


2016年他加入Meta,联合微软推出ONNX,主导PyTorch 1.0,今天几乎所有主流AI模型都跑在PyTorch上;三年后,他以技术副总裁的头衔加入阿里,主导大规模AI基础设施建设,积攒了生产环境运营GPU集群的一手经验。


2023年贾扬清离职创业,与同样来自Meta AI的白俊杰联合创立LeptonAI,拿到了1100万美元种子轮融资,承载的正是“降低AI工程师使用和管理GPU集群门槛”的想象力。


三大开源框架、两家顶级大厂、一段中国市场经历——这是贾扬清带给英伟达的筹码。英伟达买下的,也不只是Lepton这家创业公司,还有AI开源社区对于贾扬清长达十年信任积累。


黄仁勋给出了足够的诚意和价格,贾扬清也带着将AI Infra推向新高度的抱负入局。这本该是一场完美的双向奔赴,但遗憾的是,在商业变现与开源信仰的碰撞下,双方最终没能走向共同的愿景。


三道无法弥合的裂缝


从万众瞩目到创始人出走,仅仅一年。据SemiAnalysis拆解,问题主要出在三道裂缝上。


第一道裂缝,是开源信仰的破灭。


英伟达在收购时承诺,Lepton的核心软件平台将于2026年开源。这个承诺,对贾扬清而言绝不是一个可有可无的细节——他的整个职业生涯,都建立在开源精神之上。Caffe开源,ONNX开源,PyTorch开源。他不是一个偶尔拥抱开源的工程师,他是那个用开源重塑了整个AI工程基础设施的人。


然而这个承诺,至今没有兑现。


SemiAnalysis的推断是:黄仁勋最终改变了主意,否决了开源计划。对于一个把开源视为信仰的创始人而言,这不是产品路线的分歧,而是根本性的价值观冲突。


回顾英伟达的开源记录:NIMs名义开放实则封闭,flashinfer也从开源社区项目变为闭源cubin内核,RIVA等ML平台也走向了类似命运。贾扬清对此不可能没有预判,但他或许仍抱有改变的希望。直到希望落空。


第二道裂缝,是产品执行的跑偏。


SemiAnalysis的措辞相当直接:"NVIDIA's product management culture did not let Lepton bloom into what it could have become."(英伟达的产品管理文化,没能让Lepton开花结果。)


实际情况令人唏嘘:团队的资源被消耗在更换配色方案和登录界面UI等表面工作上,而真正的核心技术问题,比如多租户(multi-tenancy)始终没有被解决。某云厂商(合作方)更是直言不讳:"Lepton解决了GPU云的所有问题,除了最难的那个。"


要知道,AI原生开发者历来不愿为英伟达的非关键路径软件付费。他们信任的是vLLM、SGLang、SLURM这些从开源社区里长出来的工具链,而不是某个大公司包装过的SaaS平台。


Lepton/DGX Lepton的目标用户,恰恰是对这类产品最挑剔的一群人。


第三个裂缝,写在股权结构里。


一般来说,标准的收购协议中,创始人股权通常分3到4年归属。贾扬清仅一年便离职,这也意味着:要么他放弃了大量未归属的股权,要么他在谈判时就争取到了一年内完全归属的特殊条款。


无论哪种情况,都说明他离开的决心极为坚定。这不是一次被动的人事调整,而是一次主动的、彻底的告别。


据早期信息显示,Lepton平台在2025年中期前后已基本停止对外运营。


Agentic Coding的降维打击


如果说价值观冲突和产品跑偏是内部问题,那么外部的模型发展和市场走向,则动摇了整个AI Infra赛道的价值结构。


LeptonAI当初试图解决的,是一个真实存在的痛点:降低AI工程师使用和管理GPU集群的门槛。开发者不想管Kubernetes,不想写部署脚本,不想折腾推理服务,不想处理扩缩容、监控和日志……这些事情繁琐、专业、耗时。所以,一个把这些复杂性打包起来的运维平台,可以让开发者专注于模型本身。


2023年,这是一个值得花数亿美元去解决的问题。但到了2026年,这个问题的门槛和解法已经松动。


以Cursor、Claude Code、Codex为代表的Agentic Coding工具正在重塑软件开发的底层逻辑。"Vibe-coding"不再是一个噱头——开发者可以用自然语言描述需求,AI Agent自动生成、调试、部署完整的基础设施代码。


比如,竞争对手AMD开源的Spur项目,一个与高性能计算调度器Slurm完全兼容的开源替代品,可以直接被AI Agent调用和配置,几乎零门槛。


这意味着什么?


Lepton试图用产品化方式解决的问题,正在被Agentic Coding用代码生成的方式直接跳过。当你的平台仅仅是把部署流程包装得更顺滑,把一些常见操作自动化,把API封得更漂亮,那么Agentic Coding的崛起会削弱它的稀缺性。


因为开发者会越来越有能力用开源组件拼出自己的工作流,用Agent修配置、写出集群管理脚本、接监控、改SDK、迁移部署环境。


这不是Lepton一家的困境,而是整个"AI基础设施抽象层"赛道正在面临的系统性挑战。


那些在2022年到2024年间以"降低AI工程门槛"为卖点融资的公司,都需要重新回答一个更尖锐的问题:你到底解决的是表层的复杂性,还是底层的稀缺性?

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。