项目叫停、团队解散、负责人离职......
特斯拉投入数十亿美元自研的AI超算系统Dojo只活了6年。
今年8月10日,马斯克在X上发文宣布正式解散「特斯拉的第一个自研AI超算系统」——Dojo。
而从马斯克在今年7月宣布「Dojo最新版本将在明年某个时候大规模运营」到8月「Dojo团队解散」,中间只隔了大约一个月的时间。
伴随项目叫停的,还有Dojo团队负责人Pete Bannon离职、约20名核心研发成员跳槽,以及随之而来的技术专利纠纷、股价下跌。
针对外界的诸多疑问,马克思的回应显得言简意赅:Dojo已踏入「进化死胡同」,芯片研发「两手抓」是不合理的,把目标集中在性能更强大的AI5、AI6上更划算。
烧了数十亿美元的Dojo,是曾被寄予「为特斯拉市值狂增5000亿」厚望的超级算力团队,目标是提升特斯拉在AI竞赛中的计算实力。
Dojo的谢幕令人意外,但绝非偶然。
对特斯拉而言,「自建算力中心」的及时止损,或许是一次务实的调整。
01
Dojo谢幕,是走进死胡同后的精打细算
自2019年首次曝光以来,Dojo不仅仅是一个超级计算机,更是马斯克实现AI算力自主可控的关键落子。
马斯克对Dojo的设想十分远大,一直将Dojo描述为特斯拉AI雄心的基石,终极形态是一个名为「ExaPod」的巨型算力集群。
如果能实现,Dojo将进入全球超级计算机榜单的前几名。
但是口号替代不了现实。
在实际研发和应用中,「高投入低产出的研发浪费、更优方案的替代」都在加速Dojo的死亡。
一方面,Dojo是一个高投入、低回报的项目。
Dojo的定位是利用海量视频数据训练自动驾驶神经网络的超级计算机,其目标之一是摆脱对英伟达GPU的依赖。
雄心壮志之下,马斯克在2024年10月还表示要加倍投入建设Dojo。
可现实却事与愿违,真金白银的投入并没有带来对应的回报。
全栈自研的基调下,2021年推出的D1芯片为了追求高性能依旧采用了特斯拉非常规的激进架构,依赖软件优化数据局部性,在实际应用中果不其然遇到了散热、功耗和系统稳定性的挑战。
同时,Dojo的自研属性自带「专力专用」的风格。当英伟达通过开放生态拿到多家车企订单时,Dojo只服务于特斯拉内部业务,导致其单位算力成本居高不下,与行业趋势背道而驰。
在Dojo D1芯片竞争力不强的背景下,今年推出的D2芯片未达预期,良率一直在37%徘徊,且面临严重的量产难题。
而另一边,采用了台积电3纳米成熟工艺的AI5良率高、性能强,也已经进入量产阶段。
据马斯克透露,AI5不仅推理性能很出色,训练方面表现也不错,打算把AI5/AI6应用到云端超算集群中,集成到一块主板上用于推理或训练,还能把网络布线的复杂性和成本降低「几个数量级」。
这就意味着新一代A15芯片,既可以推理,也可以训练,且性能又不差。
这样看来,Dojo的存在就显得「多余」。砍掉Dojo团队,推出训推一体的新芯片,看起来更像是马斯克的一次精打细算。
另一方面,建设智算中心,需要承担巨大的财务压力。
特斯拉曾投资5亿美元用于建造Dojo,但马斯克承认「每年至少需要几十亿美元的投入」才能维持其在AI领域的竞争力。
但目前,特斯拉的造车业务却陷入困境,销量面临下滑风险。截至2025年6月30日,特斯拉电动汽车销量同比下降16%,总销量下降12%,美国市场销售份额从2022年的75%跌至不到50%。
而压垮Dojo的最后一根稻草,是替代方案——Cortex超级计算机集群的出现。
2024年1月,特斯拉宣布向英伟达购买了约1万块H100 GPU,并由此开始了Cortex新计划,为训练FSD系统和Optimus人形机器人提供支持。
在德克萨斯州紧锣密鼓建设中的Cortex 2.0集群,是一个混合系统,不仅会包含特斯拉的Dojo硬件,还将大规模部署英伟达GPU,训练效率比Dojo提升了数倍,并且已经承担了特斯拉5%-10%的自动驾驶数据处理任务。
据悉,特斯拉已部署了约5万块H100 GPU,并计划将这一数字增加到10万块。
由此来看,Cortex不仅仅是一个简单的「特斯拉+英伟达」技术混搭,更是一种具有可持续性发展能力的「算力思维」的转变:
从「我造的比你强」转向「我能比你更好地整合资源」,从「完全取代」转向「差异化补充」。
当一个更低风险且更可持续、更强大、更成熟的方案出现,Dojo的命运便已注定。
02
云端算力竞争走向「合租」时代
Dojo的「谢幕」和Cortex的「崛起」,并不意味着特斯拉全栈自研算力的失败,反而显示了一种趋势:车企之间的算力竞争,正从封闭走向开放、从自研走向云端协作。
Dojo的关停,正是车企「自建算力中心」承担高风险下的一个缩影:建设成本高昂且周期漫长、技术更新迭代容易僵化、算力基础设置的弹性和灵活性较差。
因此,越来越多车企选择更为「轻量化」的低风险方案——与算力云厂商共建或外购算力服务。
在海外算力云厂商中,谷歌、亚马逊和微软,早已经成为车企的「算力合伙人」。
今年年初,亚马逊云宣布与本田汽车达成合作,共同推动本田汽车的SDV转型。
本田将使用亚马逊云科技IoT服务为行驶中的汽车提供持续的软件开发与更新支持,利用高算力来协助本田汽车高效收集、转换车辆数据,并高速其传输至DPG平台。
这种云端连接能力能够有效提升车辆的质量、安全性和自动驾驶能力。
在国内,据共研产业研究院《2025-2031年中国汽车出行云行业全景调研及投资战略研究报告》数据,预计2028年汽车出行云市场规模将突破200亿元,年均复合增长率达13.2%。
目前,华为、阿里云、百度智能云、腾讯云、火山引擎已经成为不可或缺的力量。
今年8月底,华为云CloudVeo智能驾驶云服务正式发布。
针对车端算力核心问题,华为云CloudVeo接入了CloudMatrix384超节点为智驾模型训练提供超强动力。
据实际测试结果显示:在端到端、VLA模型上,CloudMatrix384超节点性能超过英伟达H100,成为最适合智驾模型训练的算力平台。
截至目前,全国超100万辆智驾车辆在华为云上,5000万辆智能网联汽车由华为云提供服务。
2022年,小鹏汽车在乌兰察布建成自动驾驶智算中心「扶摇」,基于阿里云智能计算平台,算力可达600 PFLOPS,自动驾驶核心模型的训练速度提升近170倍,端对端通信延迟降低80%至2微秒,存储吞吐比业界20GB/s的普遍水准提升了40倍。
到2024年,小鹏汽车与阿里云共建的AI算力规模提升超4倍,核心模型的训练时长也大大缩小。
今年8月,长安汽车和百度共建的「长安汽车智算中心」正式揭牌。
利用「百舸AI异构计算平台」,长安汽车智算中心的模型训练速度最高提升了125倍,计算能力达到了142亿亿次/秒,算力总体平均使用率提升到90%以上,大大加速了自动驾驶的研发进度。
火山引擎相继与岚图、梅赛德斯-奔驰、赛力斯、元戎启行、四维图新等达成合作关系,提供相应的算力解决方案。
上述云厂商,正在凭借独特的优势,成为智能驾驶算力的「运营商」。
一方面,云厂商凭借庞大的算力业务体量,能够构建起云计算的全链条规模优势,将算力成本降至车企自建难以企及的水平。
例如,华为云部署CloudMatrix 384超节点,建成贵安、乌兰察布、芜湖三大汽车专区,形成全国分布式算力网络,可以跨区域资源调度进一步提升集群利用率,摊薄单节点建设成本。
同时,头部云厂商凭借海量订单可以获得芯片厂商的阶梯价优惠,相比车企单独采购,芯片采购成本可大大降低。
车企为算力业务单独投入的基建资金相对减少,可以将主要资金专注于功能优化、品牌塑造和用户体验。
另一方面,云厂商作为服务商,算力的售卖具备「弹性」。
「弹性算力」的代表之一,是亚马逊的Amazon Elastic Compute Cloud。据悉,在超大规模仿真验证阶段,Amazon Elastic Compute Cloud可以提供百万vCPU级别的低成本算力,最多可节省90%的成本,加快自动驾驶技术的研发和落地。
云厂商的「按需购买」设计,可以精准匹车企「研发波动大、需求不确定」的特点,让车企缓解固定投入的资金压力,避免算力和资金的浪费。
此外,云厂商并不局限于提供算力资源,而是提供从算力、存储到训练工具的全链路支持,技术实时更新、运维实时到位。
例如,腾讯云TI平台为车企提供全栈AI开发服务,覆盖数据获取、处理、模型训练、评估、部署、应用全流程,甚至包括销售、客服、组织管理等方面。
完善的生态能够让车企专注于核心算法研发,无需担忧技术迭代与基础设施稳定性。
在智能驾驶的算力淘金热中,云厂商正在成为「卖铲子的人」。
这些云厂商凭借规模效应和灵活租赁模式,成为智驾行业的基础设施层。它们提供的,不再只是存储或计算,而是一整套「算力即服务」的解决方案。
而车企在面对日益白热化的竞争时,将算力「外包」出去,会是一个更加务实和精明的选择。
03
上云竞速:车企的第二战场
「在接下来的若干年,一家在AI领域拥有雄心的车企,如果想跟上行业发展的节奏,一年在AI算力方面的投资,应该要达到10亿元这个门槛」,行业人士的这番论断,似乎正在成为行业共识。
进入2025年,云端算力成了车企的第二战场。
吉利星睿智算中心,综合算力超过23 EFlops,目前中国车企第一。
理想的云端算力,一年内从2.4 EFLOPS提升至13 EFLOPS(截至今年8月),一年内增长5倍之多。
而在今年9月,华为乾崑智驾也宣布云端AI算力提升至45 EFLOPS。
算力储备每提升1 EFLOPS的背后,都是数十亿真金白银的投入。
但是,10亿元的投入也仅仅只是一个门槛和起点,远远达不到天花板的层次。
据36氪和中国电动汽车百人会的统计数据,搭建1 EFLOPS的算力所需成本约为3.7亿元,而行业平均算力已达3 EFLOPS以上,这意味着单家企业在AI算力上的研发投入至少10亿元起。
李想曾在2025年第二季度财报会议上表示,2025年的研发投入会超过100亿,其中AI要占到60亿,接近六成。
华为车BU CEO靳玉志也曾在采访演讲中表示,2025年华为计划仅在训练算力这一项投入就超过40亿元。
Momenta CEO曹旭东曾表示,智驾越往后走,云端算力越占大头,2027年Momenta将有数十亿元用于算力投入。
这些数字意味着,AI时代的车企,正在变成科技公司。
而特斯拉Dojo的结局,也让行业意识到,全栈自研并非最优解。
在技术更新极快、资本消耗巨大的赛道上,专业分工协作比全栈自研更加有效。
车企自建超算中心就像一个无底洞,始终面临着建设成本高昂且周期漫长、技术更新慢、算力灵活性差等问题。
面对强大的外部竞争和内部研发的巨大投入,马斯克可能意识到,在每一个环节都做到全栈自研,排斥外部合作似乎是一件不划算的买卖。
意识到这一点,马斯克没有选择把Dojo一条道走到黑,而是及时抽身出来,将部分算力研发与英伟达、AMD等行业巨头达成合作,利用外部成熟的、可靠的供应链来迅速落地,开始了Cortex的开发建设。
Dojo的关停不仅敲醒特斯拉,而且还为所有试图自研云算力、自建算力中心的车企敲响了警钟。
华为、阿里云、火山引擎等专门为车企提供云算力的服务商,尚且面临巨大的研发压力,对车企而言,难度更是呈指数级上升,且要在云算力「技术护城河」中拔得头筹的难度更大。
所以,对于车企而言,算力是基础,但绝非目的。
找准AI时代的生态定位,抓住当下云算力的生态开放环境与产业链协作优势将成为车企在智能驾驶下半场的突围关键,远比盲目追求EFLOPS数值堆砌、陷入「算力军备竞赛」更具长远战略价值。
而对云算力服务商而言,如何满足不同车企的差异化需求,如何在「标准化算力技术底座」与「个性化适配」之间找到精妙平衡,深度响应不同车企在研发阶段、技术路线、业务规模乃至合规要求上的差异化需求,将决定共建云算力生态能否良性发展。
从特斯拉放弃自研Dojo到拥抱自建Cortex,再到众多车企砸钱牵手云厂商,算力的竞争,不再是单一车企埋头苦干的独角戏,而是车企与云厂商协同作战的团体赛。
在未来,车企需要思考的,不仅是如何成为技术领先者,更是要成为「懂得平衡、善于整合、精于协作」的战略家。