贾可对话余凯、沈劭劼：物理AI潮下，谁能活下来？-虎嗅网

本文来自微信公众号：汽车商业评论，编辑：黄大路，作者：推动新汽车向前进

“光是算力交电费，我们就交了不止10亿元。”

2026年5月16日，在第十八届轩辕汽车蓝皮书论坛上，卓驭科技CEO沈劭劼的一句话，撕开了目前自动驾驶行业最残酷的成本逻辑。

那些曾经依靠几十个工程师、几台服务器就能跑通NOA的时代彻底终结了。现在，自动驾驶的研发必须用一年几十亿的投入去博取模型的性能跃迁。

当天，轩辕矩阵CEO/总编辑、轩辕同学校长、世界新汽车生态协会理事长贾可把两位智驾圈的顶级玩家请到了JackTOK尖峰对话现场。

一位是地平线创始人兼CEO余凯。地平线不只造芯片，还向上生长出HSD智驾系统、咖咖虾舱驾融合智能体操作系统、星空舱驾融合智能体芯片，从底层硬件一路打通到整车智能体。

另一位是卓驭科技CEO沈劭劼。卓驭科技从大疆的视觉方案起家，从乘用车到重卡，从Robotaxi到无人物流，把智驾能力从单一场景做到了跨垂类全覆盖。

在自动驾驶技术路线空前收敛的当下，入局者越来越多。独立供应商、科技巨头、主机厂，谁都想来分一杯羹。

一边是数字AI巨头每年几百亿美金的算力狂飙，一边是独立供应商量级悬殊的资金投入。后者凭什么不被碾压？那道护城河，能挡住什么？

面对深不见底的研发深渊，在整车利润极度微薄的背景下，那些高喊全栈自研的车企，到底跟，还是不跟？

毛坯、样板间与精装修

“今天大家开始说物理AI之后，我感觉不是转折，而是它终于来了。”

沈劭劼的这句话，点出了行业底层逻辑的变化。在传统机器人学中，机器人的“移动”和“操作”是割裂的两套系统；但端到端数据驱动范式的成熟，终于将这两个维度的技术底座统一了起来。自动驾驶，本质上就是当前体量最大、商业化最成熟的“移动机器人”。

既然大家都在通往物理AI的“罗马”，用什么姿势赚钱就成了分水岭。在这里，余凯和沈劭劼展现了完全不同的“造房哲学”。

余凯坦言，地平线在冲击最高阶的城市NOA时，遇到了一座名为“英伟达”的高山。面对对手庞大百倍的软件生态，地平线必须打破只做芯片的常规，亲自下场做算法和系统。

他的比喻极其精妙：“我们卖芯片这个生意，本质上是卖一个楼盘，这个楼盘是毛坯房。但如果我要让这个楼盘卖快一点，我一定要激发起用户对这个楼盘的向往感……所以我一定要让我的合作伙伴、让车厂相信，在地平线的毛坯房上，你至少可以打造出这样一个令人向往的自动驾驶系统。”

这就是“样板间”战略，不做精装修，但要做“毛坯+样板”的组合，让客户看到上限、建立信任，然后自己选择装修的程度和方向。

这条路线的核心逻辑是：通过向上延伸来拉动底层芯片的出货。地平线的本质仍是芯片公司，但在这个“软件定义一切”的时代，纯粹的芯片供应商已经失去了话语权。你必须证明你的硬件能跑出什么样的效果，客户才有信心下单。

沈劭劼的团队选择了另一条路线，专注于基于原生多模态基础模型，做极其出色的“精装修”。

“我们的着力点是系统……其实我们从来不打造毛坯房，我们基本上都是交一个个公寓出去。”

这种路线的优势是极致的效率和可迁移性。卓驭利用大模型“零数据迁移”的泛化能力，迅速将智驾能力从乘用车降维打击到了重卡和物流车领域。

一个几十吨的满载重卡，与一台家用轿车，在“移动”这个底层能力上是相通的。只要模型学到了物理世界的规律，换一个载体、换一个场景，只需要微调甚至零迁移。

智驾供应商的护城河

提到自动驾驶，大家聊的都是VLA、世界模型、原生多模态基座。乍一看，似乎大家都在同一条轨道上狂奔，但实际上技术路线已经走向趋同。

余凯坦言：“你说仿真世界模型做不做？做。端到端做不做？做。多模态做不做？做。有谁不做吗？强化学习做吗？必须做。其实我觉得更多的是一些谈资而已，真正上牌桌的玩家里面，技术路线没有本质区别。”

他在对话中抛出了一个深刻洞察：“苹果的制胜之道不是靠一个idea，而是靠5000个ideas的累加……如果你是靠一个buzzword，我觉得这个赢的时间是很短暂的。但如果你是靠5000个idea累加起来的，其实你是有护城河的。”

而这5000个Ideas，就是所谓的“魔鬼细节”。对于地平线这样的芯片厂商而言，细节是3年研发周期中，每一处架构微调对算法效率的提升。

沈劭劼则提供了一个更具商业洞察的维度：护城河还是“时间差”带来的竞争屏蔽。

以重卡自动驾驶为例，卓驭之所以能切入，不仅仅是因为模型先进，更是因为他们在控制、软硬一体、油电同智上，有着长达数年的历史积累。重卡与乘用车在载重、动力逻辑、电子电器架构上的差异，通过数学建模积累出来的经验，短时间内无法逾越。

他说道：“您说是不是别家做不了？不是，但是商业上其实很多时候是时间差。在一个暂时没有人竞争的地方，我能够以更快的速度切进去，那就是护城河。”

自动驾驶的战场上，模型只决定了你的起跑线，而非终点线。真正的决胜点，在于工程化能力的溢价、数据闭环的广度，以及底线思维的深度。而这一切，最终都要靠那个愿意在魔鬼细节中，比别人多走一万步的人来实现。

大模型巨头的威胁

在2026年的语境里，谈论AI就绕不开Scaling Law。当数字大模型靠着Scaling Law在云端狂飙时，自动驾驶公司手里的数据墙，还能扛多久？

沈劭劼毫不掩饰他的危机感。他最怕的不是同行，而是那些真正的大模型公司。他坦言，自动驾驶目前的模型体量，与真正的云端大模型相比依然是“中型”的。他最怕的，就是“做数字AI的真正大模型公司反过来把我们给灭了”。

为此，卓驭必须加速拥抱原生多模态基础模型，让自动驾驶也能吃到Scaling Law的红利。如果智驾模型还停留在“小模型+规则兜底”的旧范式里，一旦OpenAI这些巨头们用大模型把物理世界理解透了，那就是一场降维打击。

但拥抱大模型的代价是极其高昂的。在算力即权力的时代，没有几十亿的储备连牌桌都上不了。

余凯也指出，OpenAI一年研发费用去年烧了几百亿美金，也意味着你如果只有10亿美金的研发，一年比如能做100个试验，它可以比你多做50倍的试验。这个领先差距一拉大的时候，用户就不给第二名任何机会了。

这就是Scaling Law的残酷之处：它不是一个“做不做”的选择题，而是一个“跟不跟得起”的生存题。

不过，余凯对“降维打击”并没有过度悲观。自动驾驶需要大量实体数据采集和工程落地，而云端AI巨头们正处于奥林匹克级别的厮杀中，稍微分心一点点就会被击溃。

他直言：“比如，Anthropic分心一点点就会被OpenAI、被谷歌跟Gemini击溃。就在AI Coding这件事上面，其实OpenAI稍微有那么一点点分心，马上就被Anthropic给超过了。”

沈劭劼则指出物理世界的容错率与数字世界天壤之别。他说道：“无论怎么降维打击，聊天机器人可以犯错，但自动驾驶出来撞两次车就拜拜了。”这种在物理世界里摸爬滚打出来的安全准出机制，是云端巨头短时间内无法逾越的壁垒。

车企是否烧得起钱

余凯在现场给出了一个自动驾驶落地时间表：2028年，实现百分之百的“脱手开”（更高级的自动挡）；2030年，实现L4级别的“闭眼开”；2035年，实现完全的“随心开”。

这意味着，自动驾驶的研发仍是一场漫长的军备竞赛。从2026年到2030年，至少还有4年的高强度投入期。到2035年，整整9年。车企如果选择全栈自研，面对的将是一个深不见底的资金黑洞。

余凯发出直击灵魂的拷问：“你今年可以投入10亿元、20亿元干自动驾驶，但这是一条开弓没有回头箭的路……明年你准不准备投40亿元？到了2030年，你敢不敢一年拿出150亿元砸在自动驾驶的研发上？对照车企自身的利润，有几家敢连续这样投入？”

对于车企来说，自研不是不能做。但问题是，你能不能把自动驾驶研发当作核心战略，持续投入十年甚至更久？

对地平线这样的专业玩家而言，即便去年研发投入50多亿元、账面亏损20亿元，他们依然底气十足——不仅因为账上躺着200亿元现金流，更因为他们的核心使命就是AI本身，所以他们能坚定地走下去。

“这背后核心还是看每个公司对自己最核心资产的投资决策，”沈劭劼也表示，“只要这个决策的答案是‘YES’，其实都能做。”

每一家企业，都应该选择一个值得长期投入的核心能力去深耕。他同时提供了另一种“生态复利”的解法：卓驭在重卡、物流等多个垂类疯狂扩张，但这类拓展所占用的研发投入，仅占整体投入很少的一部分。

“我可以顺便拓展出去，那我为什么不做呢？”这种“顺便”，就是专业分工的降维打击。

而车企如果不顾现金流在“悬崖边跳舞”，极有可能被沉重的研发拖垮主业。“我们永远不在悬崖边跳舞。”余凯说。

对于2026年的汽车产业而言，有节制的拓展，比盲目高喊自研，更需要勇气。

未来能活下来几家

在对话的最后，面对“未来能活下来几家”这个充满焦虑的常规问题，两位从业者展现了惊人的默契与格局。

余凯说：“这个世界上，任何一家企业都吃不下全世界的市场。我认为企业如果有这种‘通吃’的想法，本身就是一种妄念……不要有太重的极端竞争思维，而是要做独特的自己，到底在这个产业里面扮演什么角色，给用户创造什么价值。”

沈劭劼的回答更务实：“我能保证每年200%、300%的增长率，出货量，账上的现金流足够。有这两个东西，我好像没有什么好担心的了。”

换而言之，两者均认为，行业内最后还剩几家是很难预测的，现在能做的就是管好自己，看自己跑得快不快。

不是每个车企都要成为特斯拉，也不是每个供应商都要成为英伟达。在物理AI的版图上，有毛坯房的角色，有精装修的角色，有造轮子的角色。关键是，你选哪个角色，你能不能把那个角色做到极致。

以下为贾可与余凯、沈劭劼的对话实录：

物理AI不是突变

贾可：今天我们的话题是物理AI（Physical AI）的进阶与自动驾驶的终局，这个话题很大。我们看这儿，Physical AI，从年初的CES开始，大家都已经随着黄仁勋（Jensen Huang）说这个事，基本上大家都进入了这个赛道。这实际上跟去年不太一样，今年我们的话题是“转折”。那你觉得从之前很热的自动驾驶赛道，突然好像演变成物理AI，这是不是一种“转折”？

余凯：今年让人比较注意的是小鹏。昨天小鹏还在这里进行了分享，它把公司基本上改成一家物理AI公司了，不叫小鹏汽车，叫小鹏集团。理想刚刚发布的新车，讲的主要是具身智能。不过从地平线的角度来看，我们并没有觉得“突然”。你对我们很了解，我们11年前公司创立的时候，公司的名字叫什么？

贾可：地平线机器人。

余凯：对，叫Horizon Robotics。所以我们是从一开始就想做机器人时代的计算平台。Horizon Robotics本质的意思就是说，做一个Horizontal platform for all robotics。什么叫Horizontal platform？其实很简单，就是芯片跟操作系统。比如说在PC时代、个人电脑时代就是Wintel，就是Windows加Intel；在智能移动手机时代，实际上就是AA，就是Android加ARM。比如说高通实际上就是ARM架构的芯片。

我们一直在思考，在机器人时代存不存在一个统一的计算架构、统一的计算平台？它有它的一个操作系统，有它的一个计算芯片的架构。所以为这件事情，其实我们已经探索了11年。我们在2019年的时候，当时把探索的很多方向都砍掉了，全力聚焦汽车。是因为我们意识到，机器人时代的计算恐怕第一个落脚点就是汽车，所以我们2019年开始就all in汽车。

贾可：这算是一种选择，算是您公司方向的一种选择？

余凯：对，那个过程是很痛苦的。如果知道地平线的发展历史就知道，我们2019年把公司砍了一半的人，外面都揣测地平线是不是快挂了。但实际上我们账上还有很多钱，我记得我们账上还有31亿元现金。那时候我们就觉得做别的事情不太对，还是觉得要聚焦。所以不要把我们自己踩成什么样，而是我们自己往自己身上捅几刀，自己做得不对，就把汽车以外的业务都砍掉了。

当时我们从六百多人砍到只剩下大概三十几个人，其实革命的小火苗也没灭，它就是今天的地瓜机器人，地瓜机器人已经成为中国机器人行业芯片方案的绝对第一名，最近市场的呼声也非常高。

所以你看到地平线整个战略的发展演化，它的路径是曲折的，但方向是坚定的。11年前，2015年7月14日公司成立的那一天，我们就要做机器人时代的计算平台，中间虽然很多曲折，但这个方向我们从来没有变化过，所以我没有觉得有“突然”的变化。

贾可：但是你主要聚焦在自动驾驶，现在你觉得有转折吗？对你们公司来说，做地瓜是另外一种选择吗？

余凯：所以地平线还是全力以赴地干自动驾驶。因为我觉得自动驾驶这场仗远远没有结束，甚至我认为只是刚刚开始。对于我们来说，我们不能有任何的侥幸心理，我觉得要付1200%的精力投入自动驾驶。所以地平线的资源，我不会把一分钱浪费在其他的事情上。

为什么让地瓜机器人开始独立融资？因为我觉得对每一场仗，你一定要有充分的敬畏之心，你全力以赴不一定赢，你不全力以赴肯定输。我们就拆成地平线和地瓜这么一个结构，地平线全力以赴干汽车。

贾可：地瓜也拆了几年。

余凯：地瓜就全力以赴干机器人。

贾可：是去年拆的吗？

余凯：已经干了三年。

贾可：好的。沈总，我们卓驭科技也是之前从大疆拆出来的，这算是卓驭的第一次转折。到今天为止，有什么变化或者有什么“转折”吗？

沈劭劼：实话实说，今天大家开始说物理AI之后，我感觉不是转折，而是我觉得它终于来了，终于变成这个样子了。

我自己的学科训练是做机器人的，包括我们之前做无人机的时候，本质上应该叫作空中移动机器人。后面决定从无人机到自动驾驶，也就是做移动机器人的皇冠。

换句话说，其实我们一直都在做机器人这个行业，我自己对外称自己还是个Roboticist。

余凯：这个我可以作证。我还没有创立地平线的时候，我那时候还在百度负责研究院，他当时还在读博士，我那时候就“勾引”他，要他加入百度，因为那时候我在百度就已经启动了机器人的项目。

贾可：但为什么没有去？

沈劭劼：有教职嘛。

余凯：当教授。

沈劭劼：找到教职就没来了。我继续说完刚刚的。其实我们一直在做机器人，但是我们相对来说会把scope稍微变窄一点，所以我现在对外喊的是移动物理AI，只做相当于机器人下半身负责“动”的那一部分。

曾经移动（Mobility）和操作（Manipulation）这两个东西是相对分得比较开的，包括在机器人内部也是两个大类。应该说在数据驱动这个开发范式——现在我们称为AI的开发范式到来之前，大家好像以各自不同的方法在做。

为什么我说今天终于来了呢？就是因为从自动驾驶引发的端到端，到后面这个东西的名字改了很多次，VLA（视觉－语言－动作模型）也好，世界模型也好，但至少在我看来，本质上都是一个基于数据驱动的开发范式。这个开发范式成功地把有点不相干的两个东西黏合在一起。

所以现在我们来看，它本质上终于能够被称为“机器人”了，应该说也算是圆了最开始机器人学科研究者一直想做个厉害机器人的梦想。

刚刚凯哥提到自动驾驶本身是一个基本盘中的基本盘。无论是之前还是现在的物理AI，能够实现大量数据输入、实现商业闭环，真正对社会产生影响力，能够让社会上大家体会到物理AI技术带来的便捷的，其实还是这一个。

以自动驾驶主赛道去搭建公司的组织，搭建团队，去搭建整个基于数据驱动开发的pipeline，其实搭建成之后，真的随时要从下半身转到上半身，这个其实并不是一个很突然的事情。

贾可：也就是说自动驾驶属于移动的下半身？

沈劭劼：对。

供应商的“造房哲学”

贾可：刚才凯哥说要把这个公司拆分成两个部分，一个是地平线，一个是地瓜，每一个都全力以赴，独立运作。要比自动驾驶投入1200%的精力，也就是12倍的力量去做这件事。因为我们知道地平线是从做芯片开始的，现在我们HSD有算法，不久之前你又做了操作系统，叫咖咖虾OS。

余凯：对，座舱。

贾可：应该是星空舱驾一体芯片，你一直在技术上深耕，从芯片、算法，到智驾融合再到智能座舱，一步步深耕，相当于你的纵向一体化，算不算纵向一体化呢？

余凯：你可以看到地平线最近几年的战略，一方面纵向做芯片和软件算法，另一方面横向从智驾到座舱。其实我们思考的不是从自己的惯性出发，而是从战略和产业发展的必然性出发。

首先地平线从第一天开始，如果了解地平线的都知道，我们一直讲究的是软硬结合。软硬结合，让我们比芯片公司更懂软件、算法，所以我们也能去设计这样的芯片架构支持软件、算法。比如说对Transformer的支持，大家知道今天市面上的每一颗芯片，它一定都是3年以前、5年以前研发的架构。

为什么地平线能脱颖而出，很多老牌芯片公司在这方面都做得不如我们好？是因为我们对算法架构的理解比他们深刻，所以我们的芯片能够支撑这些软件、算法更好开发、更好部署、更高效地运行。

其实我们前面从低阶到中阶，基本上打赢了所有战役，突然遇到了一座“高山”，那就是英伟达。这就是最高阶的自动驾驶，即城市的NOA。突然我们发现城市NOA这场仗太难打了，因为你需要的是一个更加强大的软件生态。

而说老实话，英伟达的软件生态要比地平线强大得多，100倍都不止，我觉得是1万倍。所以在这个时候，地平线跟地平线上部的软件生态打城市NOA这场仗的时候，就显得有点力不从心。

另外一个是华为，华为也是非常强大。我觉得地平线如果不去打最高阶，不打一个样板间，就是HSD，我觉得地平线就肯定完蛋了。

我打一个比方，比如我们卖芯片这个生意本质上是卖一个楼盘，这个楼盘是毛坯房。但如果我要让这个楼盘卖快一点，我一定要激发起用户对这个楼盘的向往感。典型的做法是什么？就是你修几个样板间，让所有来买这个楼的人都觉得一进去，我要买的毛坯房至少可以装修成这个样子。所以我一定要让我的合作伙伴，让我的车厂相信，在地平线的毛坯房上你至少可以打造出这样一个令人向往的自动驾驶系统。

贾可：你说它的生态比我们大1万倍，是怎么得出这个结论的？

余凯：基于数据。数据很重要，它的生态不仅大很多，而且强大很多，人家市值都达到45万亿了。对于地平线来讲，要打造样板间，但因为有了这个样板间，主机厂和我们的合作伙伴对地平线的芯片、平台、工具链更有信心。

但这也不代表我们就不开放。举例，比如苹果App Store是不是开放？肯定是。但苹果上面也自己打造地图，但这不代表苹果不支持高德地图、腾讯地图、百度地图等方方面面的地图，所以其实这是一个共生的生态。

贾可：我明白了。但你说地平线芯片是毛坯房，我们要做算法实际上是要打造样板间。但是你要知道毛坯房有很多种，如果是公寓毛坯房，那在上面打造出来的也只是一个公寓；如果是独栋别墅毛坯房，那就大不一样了。如果你买的是其他毛坯房，怎么打造也成不了公寓，公寓也变不成别墅。

所以沈总没有只做毛坯房，他可能要对各种毛坯房都进行打造、装修，因为卓驭是从视觉出发来做算法的。那你觉得你跟地平线的路径有什么不一样？

沈劭劼：对，其实我们现在叫作移动物理AI，跟凯哥这边比较不同。我们在车里面更加深耕更多的类别，我们有点像是在横向展开。但其实这已经是我们第二次干这个事了，只不过第一次从天上到地上的时候，那本身就是一个横向展开，只不过当时只能选择A或B去做。

现在不是，现在我可以选择全部，也是由于开发范式发生的变化。所以我们在今年把乘用车、商用车、物流车直接横向展开，我觉得这是一个很好的时间点。

刚刚凯哥提到前面遇到了英伟达这个很大的敌人。对于我们来说，我们的着力点是系统，就是要确保智能驾驶系统能够交出来。其实我们从来不打造毛坯房，我们基本上都是交一个一个公寓出去。

余凯：他是精装修。

沈劭劼：对，我们只做装修。但是随着端到端这个范式落地之后，后面我们也遇到一个很大的麻烦。

Scaling Law的威胁

沈劭劼：当然，一方面是我们自动驾驶行业的领导者开始了，特斯拉本身的FSD V12、V13、V14这个模型越来越大、能力越来越强。

另外一方面是真正的大模型行业的变化，比如说OpenAI也好，字节跳动也好，其实这才是真正让人觉得害怕的地方，因为它出现了Scaling Law，通过增加模型规模、增加数据多样性，能够带来整个模型的表现和质变。

自动驾驶到今天为止，特斯拉可能有，但除了特斯拉之外，没有一家能够真正看到Scaling Law的落地。因为本质上大家受制于端侧算力和各种各样的原因，它本身其实跑的都是这种中型的模型。其实这实际上是我觉得非常非常害怕的。

这也包括我们落地到不同垂类。我们成功落地了重卡，业务上也获得了很多成功，包括全国前六的重卡OEM现在都是我们的客户。但过程中我们也受到了一些教育，比如模型要进行适配是需要代价的。重卡一个行业我们能搞得定，但更多的行业、更多的客户可能会出现搞不定。

这两个问题本质上是同一个问题合在一起了——现在自动驾驶的模型并没有达到真正的大模型阶段。你说现在我怕什么？我怕做数字AI的真正大模型公司反过来把我们给灭了。这时候就让我们更加坚定，得让自动驾驶也能看到Scaling Law。

这个代价有几个方面。

第一个模型本身得变大，开发范式得变化，可能从原来我们更依赖于后面去适配的fine-tune，变成更依赖于预训练。依赖预训练，首先模型得能够吃得进去，模型的规模得变大；然后部署的方式也从直接训练一个端侧部署的模型，变成我训练一个大模型、再进行蒸馏压缩的技术范式。

但同时更重要的是，它的训练代价成本会直线上升，现在付出1000%的努力跟以前付出1000%的努力不在一个概念上，光算力一年就十几二十亿元这么投进去。那这个商业本身是得获得闭环的，要获得闭环，很显然，我得想到方法去分发我这个模型才行。那很自然地，它又回到多垂类，所以整个事情就闭环起来了。

技术路线走向趋同

贾可：我知道我们卓驭科技是做原生多模态基础模型，现在我们凯哥是做大模型+世界模型，强化学习、世界模型。

余凯：其实行业里面有什么VLA、VLM，什么世界模型，其实我觉得是商业大于实质，因为大家干的事情只要是靠谱团队，干的事情都差不多。

贾可：世界模型是用来泛化的。

余凯：世界模型说白了就是仿真去产生很多的虚拟数据，这个有谁不在做？其实谁都在做。所以这些技术的buzzword是用来吹牛的。

贾可：包装，是吧？

余凯：其实A、B、C、D、E、F、G这些事情，其实每家都在干。

贾可：那你说说你具体的路径是怎么做的？

余凯：有什么技术路径？

贾可：还是都一样？

余凯：你说仿真世界模型做不做？做。端到端做不做？做。多模态做不做？做。有谁不做吗？强化学习做吗？必须做。其实我觉得更多的是一些谈资而已，但实际上真正上牌桌的玩家里面，技术路线没有本质的区别。

沈劭劼：我稍微补充一下，其实它不是各个玩家之间的本质区别，而是大家共同发生的一个变化，有点像是帮凯哥回答的，我相信领导会同意的。

余凯：现在吹VLA，他说我们新一代的VLA系统，我们弱化了“L”。

贾可：那不都是你们自己说出来的吗？

余凯：就是VLA已经变成一个商业词了，已经不是技术实词了。因为你把“L”去掉的话，其实不就是典型的说video-in-control，典型的E2E（端到端），对吧？但你还叫个VLA。

沈劭劼：或者为什么说那个东西叫原生多模态基础模型，这几个词其实是有意思的。

首先为什么它是原生的？那是因为我们端到端之后，我们有一段时间就会说VLA。但VLA本身是依赖于一个预训练的大语言模型，比如说拿了一个千问做预训练，然后再在上面把它接action decoder让它出来。

然后“原生”的意思是说，我不用一个用语言模型预训练的模型，我完全用自己的数据进行一个相同规模、几个模型的预训练，所以这个叫作“原生”。那它没有依靠非自动驾驶或者非移动机器人数据的这些干扰，其实它能够练得更纯粹一点点。

多模态其实没什么好说的，大家都在做。基础模型本质上底层是把这个模型从一个中型模型变大。

余凯：它的原生是什么？它没有用基于千问什么开源模型，它从头都是自己搞的。

沈劭劼：比如强化学习其实是我们进行后训练的一个动作。当然，这听起来好像和基础模型、强化学习有矛盾，不是，它其实是在我们做整个模型预训练、后训练的两步而已，只是看哪一家强调哪一步而已，其实大家都在做的。

细节和时间差很重要

贾可：你刚才说你们的区别只是说谁强调哪一步，还是说你们两边没有本质上的区别？这些技术路径。

余凯：我来讲一下。其实细节是魔鬼，你不可能说靠一部《九阴真经》就打遍天下了。我记得乔布斯说过：“苹果的产品制胜之道不是靠one idea，而是靠什么？Five thousand ideas（5000个ideas）。”

这个数字也不重要，有可能是1万或5万，但整个观点就是说其实是“无数的细节是魔鬼”。

你不可能是靠一个buzzword，如果你是靠一个buzzword，我觉得这个赢的时间是很短暂的。但如果你是靠5000个idea累加起来的，其实你是有护城河的。

所以我觉得大家千万要相信一点，这个世界上没有捷径，这个世界上没有可以一招制胜的，你一定要做好一个准备，就是你要日积月累。而且你要有很多的想法，很多的ideas，把它们累加在一起。

贾可：那你说“魔鬼”在细节之中，然后又说很多东西要日积月累，那你这个细节到底是什么？细节可能是互相区别所在，地平线的区别在哪里？

余凯：比如我们芯片这件事，你任何一代芯片整个研发周期至少都是研发大概3年时间，整个量产差不多快1年时间爬坡，持续地出货、持续地精进也需要至少2—3年。一看就是长周期，这里面肯定有无数的细节。

贾可：这是周期，它不是细节？

余凯：就是细节，里面任何一件事情如果做错了都会影响最终的结果。

贾可：沈总他们不做芯片，你有很多芯片都可以用。凯哥说他做芯片有优势，各方面一条龙他懂，你不做芯片就没有这个优势，是这样吗？

余凯：那软件也有很多细节。

沈劭劼：我理解它是整个系统链路上每一步如果你做到极致，包括集成这一步本身都是一个护城河，本身软件现在大家都说大模型，也都知道往后肯定是数据驱动越来越端，但怎么做到越来越端？

大家都知道模型有幻觉，可能会犯傻，那怎么最后让它输出不犯傻？每家公司但凡能把模型部署出去，它一定背后有一套很完整的测评体系，我相信大家不会摆到台面上说，其实里面花费了大量的心血。

可能模型之外Tier 1会承担集成角色，跟整车的交互以及不同车型之间的区别会更有感触。例如现在重卡为什么我们能切入？是因为我们的模型更厉害吗？不仅是。除了模型以外，也是因为我们在控制、软硬一体和油电同智上的长期的积累，这些都是细节。

重卡它本身的动力形式和乘用车非常不一样，它的载重从零到几十吨、到满载50吨这种级别，我怎么确保这个算法——而且我不知道到底装了多少东西在后面，这个算法能够对这些不同的载重搞得定？这里面除了模型的帮助以外，还有很大一部分是数学建模，这些基础它其实需要历史积累出来的。

包括在商用车，商用车寿命的标准跟乘用车不一样，它考虑的是持续运作中的寿命，以及本身电子电器架构电压也不一样，本身我们有传感器、控制器能够做到快速反应。您说是不是别家做不了？不是，但是商业上其实很多时候是时间差。

贾可：你们有传感器这些能力，所以让你们做重卡、物流车更顺风顺水，是这个意思吗？

沈劭劼：是时间差的问题。或者像之前凯哥说到的，在没有人竞争的地方竞争，那在一个暂时没有人竞争的地方我能够以更快的速度切进去，那就是护城河。

贾可：凯哥是做芯片，没有做传感器。所以重卡、物流车你们做吗？

余凯：我们大部分时间都没有做，无论是物流车还是重卡这些方面我们有大量的合作伙伴。我们通过合作伙伴做，现在95%以上的项目都不是我们直接做的，通过合作伙伴做。

贾可：沈总，卓驭有没有用过他们的芯片？

沈劭劼：有。

余凯：我们在合作，吴新宙那边我们也在合作，行业里面绝大部分自动驾驶公司我们都建立了非常好的合作伙伴关系。

沈劭劼：第一个用地平线芯片的车今年Q3量产，也是有城市NOA的。

贾可：那你们互相之间不也是竞争对手吗？

余凯：没有，我们没有在任何一个项目上竞争过。

谁在定义“高质量数据”

贾可：沈总讲过一个三段论：以前小模型技术能力是40分，端到端70分，大模型到90分了。现在咱们的原生多模态基座模型，你觉得它的基础能力到多少？

沈劭劼：我当然希望它开箱就90分。现在测下来应该是在70—90分之间，老实说到最后的量产肯定有一定的打磨。但是我非常有信心。

几个体会下来，跟现在端到端的区别是，比如现在端到端驾驶的感觉就是，我可能人看到有一个危险场景出现，大概过了0.1秒的时候车有反应了，这个时候我就会觉得这个模型挺安全的，因为我看到的它都看到了。包括在北京车展的时候也放出让大家体验，不少体验者都会有这个感觉，开着开着忽然这个车踩了一脚刹车，然后它就问怎么了，然后才发现那个东西才出来。

其实跟人的反应时间正好快一点和正好慢一点的区别，但这是一个质变，它会带来信任感的质变。当然现在的状态可能还有一些瑕疵，但是当我看到这个质变之后，我就非常有信心了。

贾可：凯哥你觉得是这样吗？你们的模型能力多少分，打过分吗？

余凯：我觉得打分不好打。首先自己给自己打分不对，我觉得应该是用户、产业界或者客户给我们打分才行，自己给自己打分有什么意义。

贾可：那你给他打个分？

余凯：我觉得他们非常厉害，在我心目中人家肯定是90分的团队。

沈劭劼：或者这个分数是一个比例词，我总得说明花了这么多钱，每一代到底有些啥进步。

余凯：我觉得打分数有点偏感性，我认为更多的是一种认可。你说打多少分，那给马斯克打多少分？

贾可：沈总你给他们打个分，他们的能力有90分吗？

沈劭劼：90分。

余凯：贾可，我对蓝皮书打分也90分。

贾可：90分就差不多了。咱们之前从CNN转换到Transformer，从端到端开始做VLA，大家发现自动驾驶实际上能力在跃迁，确实在跃迁。这次跃迁我看资料，包括卓驭刚才沈总讲，你们从乘用车的自动驾驶迁移到重卡。你讲的是后面做传感器、控制器能力强，所以导致你们的迁移还是比较容易的。

但你们还有一个零数据迁移的能力，是因为你们的原生多模态基座模型的能力，你这个给我们解释一下，零数据迁移导致你们从乘用车切换到重卡、物流都比较容易，是这样吗？

沈劭劼：其实这个就是Scaling Law换了一种说法。当模型的规模足够大，能够在预训练的阶段吃进尽量多不同场景下，甚至不同平台的数据，而不像原来我们用端到端多模映像那么依赖高质量的乘用车数据。

我相信凯哥应该有经验，之前中型模型的时候，输入的数据但凡传感器弯一点点，可能最后训练出来的模型就会出问题。但是到现在，当训练范式更偏向于大模型预训练之后，其实对于数据的质量要求是会大幅度降低的。

当然我需要用高质量数据来进行冷启动，但是到后面包括互联网这些数据、这些东西都能够训练。所谓的零数据迁移并不是说什么都没有见过的时候自己学会了，而是我能够通过更多的处境去学会这些知识。

贾可：你刚才讲对数据要求降低了，你们的数据是真实人类的数据还是仿真数据？

沈劭劼：预训练阶段基本上都是真实数据。

贾可：但是凯哥说过一句话，90%的人类数据没啥用，是垃圾数据，还是仿真的一些数据要强。你讲讲你的观点是什么？

余凯：人类数据可以吃到的红利（low-hanging fruit）其实大家都已经吃完了，基本上这么说。后面怎么样进一步从现在的辅助驾驶走向无人驾驶，这段路是最难的。

这段路我觉得包括马斯克也是刚刚开始。所以现在你要遇到真实场景中对你有价值的Corner Case难度越来越高了。现在行业基本上做到每百公里接管一次，很有可能经过一年大家做到每千公里接管一次，两年以后假设做到1万公里接管一次，正常情况下一年才碰到一个Corner Case，碰到的Corner Case的这种效率越来越低了。

但我知道目前的系统瓶颈在什么地方，比如在北京的朝阳区路边很多的临停车，突然一下子门打开你怎么办？这种Corner Case你遇到的概率是不高的，那你怎么产生这些Corner Case？那就是通过大量的仿真去产生这些Corner Case。

所以我认为顶级团队去进一步的进阶，就一定更多利用仿真数据，而不是真实世界的数据。不是说真实世界数据没有用，只是说这个红利大家都吃到了。

贾可：是这样吗？

沈劭劼：其实只是本质上获得Corner Case的两个途径而已。Corner Case很难采集，但是我想说网上有大量的Corner Case的数据，各种稀奇古怪行车记录仪的数据多了去了。

但问题是这个模型得能够吃得进这些数据，而不会让这些数据由于传感器视频质量的问题让模型训练越来越差。相当于大家都知道Corner Case很难，只是在预训练阶段和后训练阶段分两个不同的步骤，去增加对Corner Case的处理能力而已，实际上我相信大家都在做。

贾可：是这样的。凯哥，刚才你说从辅助驾驶到完全的无人驾驶还有很长的路，包括百公里或者千公里、万公里接手，路好像还是很长。但是我们刚开始聊的时候大家也达成共识了，好像往无人驾驶这个技术路径、方向都是趋同。如果这样的话，到底什么阻碍了我们往L4、L5去呢？

数字巨头不会杀死比赛

余凯：我有时候在想，比如你看OpenAI他们的护城河到底在什么地方。

贾可：那不能问我，问沈总。

沈劭劼：要不凯哥你先回答。

余凯：我觉得有几个护城河。一个护城河是投资的规模。OpenAI一年研发费用去年烧了几百亿美金，也意味着你如果只有10亿美金的研发，一年比如能做100个试验，它可以比你多做50倍的试验。所以得到更好的模型概率必然比你高，那它一年领先你，两年领先你，三年领先你，四年领先你，这个领先差距一拉大的时候，用户就不给第二名任何机会了，对不对？你看Anthropic其实也是一样，它有人才的优势，有资金的优势。

贾可：护城河第一是资金优势，第二个是什么优势？

余凯：人才优势也算，能付得起这个钱。

贾可：一个意思。

余凯：最终转化成一个时间的优势。如果你要跨越万水千山达到人家这个水平，你需要花多长时间？如果你还需要花5年时间，对不起，市场不给你机会了。

贾可：沈总，同意凯哥的观点吗？

沈劭劼：同意。包括我们跨垂类本身，我们看得到做更先进的模型需要更多的钱，说穿了得想办法把钱给赚回来，是吧？

贾可：对。沈总我刚才听你讲，你现在很担心搞数字AI的这些人把咱们搞自动驾驶这些人给颠覆了。这里面暗含的意思，有可能也许是小公司它有一个颠覆性的动作，就能够把这个大象给吃掉了？

沈劭劼：我不是那个意思。

余凯：他讲的是一年可以投入几百亿美金的公司。

沈劭劼：跟我刚才说的OpenAI的核心竞争力是同一件事。

余凯：我没跟他讨论过，但是我能猜到他大概想的是什么。

贾可：是这个意思吗？

沈劭劼：对。本身无论从数据量、人才，以及数字基建，它绝对是比……，我不知道凯哥算是什么公司，反正我们这种中小公司就是看他们会更先进的。

余凯：你比如说像卓驭这样的，我大概可以猜到他在数据基建、数据管理、数据挖掘可以支撑什么。比如500个工程师同时在这个平台上面开发，同时大概一个礼拜运行10个模型、10个试验。还有很重要的是，一个模型出来了以后就像炼丹一样，现在讲大模型叫炼丹，因为过程是不太透明的。

贾可：为什么？

余凯：因为得到一个结论——这个模型到底好不好是一个非常难的问题。它有可能这里好、那里撬起来了，那里好、这边撬起来，最后看overall是不是好。要回答这个问题，对于基建，对于回灌、仿真、测试都是很重要的。但是如果来一个新来的玩家，假设你有100亿元人民币，你估计达到这样的基建水平，我估计至少要两年时间。

沈劭劼：我想说，不用那么灰心，都是测评准出的机制。让一个聊天机器人准出和让一个自动驾驶模型准出完全不是一个概念，它更多是看高分的思维还是底线的思维。我理解，本身是我们这些在所谓的物理世界里面摸爬滚打足够久的公司一个很强的护城河，这里既包括机制本身，也包括里面的工程师们大家的底线思维、工作文化。看数据可能好一点，但是底线低过我的安全指标，是绝对出不去的。

贾可：刚才凯哥的担心，或者我理解是“大力出奇迹”，就是有大钱的公司他们的护城河高。我们以前一直讲有很多创新的小公司能够一夜之间把大公司颠覆，因为它可能把范式改变了，或者把一些基本的规则推翻了，有可能做到。

但在现在这样一个物理AI时代也好，或者叫数字AI公司，他们是不是因为已经是巨无霸了、已经有足够的实力，所以对他们来讲的话，而且我们的道路方向已经确定了，所以这样的大公司就很难被推翻了？

余凯：我觉得结论是的，我对这点不是特别担心。你看现在Anthropic、OpenAI这些公司，他们还在玩命投入他们的基建，为什么？因为他们那场比赛也是奥林匹克，也是刀光剑影，也是稍一不留神就被对方击溃。所以他们还在疯狂地投算力和数据中心。

比如，Anthropic分心一点点就会被OpenAI、被谷歌跟Gemini击溃。就在AI Coding这件事上面，其实OpenAI稍微有那么一点点分心，马上就被Anthropic给超过了。

真正站在奥林匹克赛场上，顶级运动员是绝对不能分心的。比如你在跳高比赛或者百米赛跑，旁边任何的噪声绝对要把它去掉，你一定要聚焦在自己的赛道，把你这场仗打好、全力以赴。我不觉得他们有任何的精力还来搞自动驾驶，比如OpenAI。

贾可：但是Anthropic也好，OpenAI也好，他们是顶级大公司。这种玩家在美国，我们在国内，你不担心他们来搞这个东西，但是万一把那些搞好以后，他们稍微降维打击一下就把咱们给颠覆了。

余凯：他们自己的仗还没有打完呢。

沈劭劼：真要降维打击，担心是担心，但真要降维打击要有几个条件。首先公司文化底线思维要能过得了，但凡无论怎么降维打击，出来撞两次车就拜拜。第二个，它本身有一个底层商业逻辑，当那个赛道赚钱赚得太容易的时候，不是太容易切到这个赛道的，这个赛道其实挺苦的，实话实说。

贾可：是这样吗？你苦不苦？

余凯：你看美国自动驾驶公司都干不下去了。

贾可：不是Waymo在干吗？

余凯：现在剩两家，一个Waymo，一个特斯拉。其实我想过这个问题，他们那帮算法专家跳槽去OpenAI、谷歌、Facebook、Meta，1亿美金一年，那赚钱太快了。你搞自动驾驶还要风里雨里搞路测，除了仿真还要搞几十万公里的路测，谁吃这个苦？如果能挣快钱干吗要吃这个苦呢？

所以美国现在有一个问题，自动驾驶公司人才荒，人才不愿意去吃这个苦了。在中国是因为反正干每个行业都苦，干每个行业都卷，所以不存在easy way。所以挑了一个行业你就认命，就踏踏实实把它干好。

沈劭劼：作为一个工业强国，我相信总是有这么一群人对造厉害机器人这个实体、让东西跟物理世界产生交集这个事是很有激情的，反正我是这样。

贾可：但是你想想在美国还有一家英伟达，吴新宙在做自动驾驶，他那个相当于是第三方供应商的身份了。

余凯：跟我们类似。

贾可：跟你们差不多？

余凯：对。

贾可：沈总，你觉得呢？

沈劭劼：一样的。

余凯：都很和谐。我们都是好兄弟。我们跟车厂那帮兄弟不一样，车厂老板没有办法坐在一桌吃饭，我们都是可以坐在一桌吃饭的。

贾可：车厂也可以在一起吃饭。

余凯：跟你吃饭。

L4的时间表与底气

贾可：显然现在大家对自动驾驶包括L4、L5到来的时间整体上我觉得是不是已经开始乐观了。昨天小鹏讲他们在5年之内就能看到，你们乐观吗？但是我感觉你们好像没有那么乐观？

余凯：我去年说了3年脱手开（Hands-off），5年闭眼开（Eyes-off），10年随心开（Mind-off）。我今天还是这个看法，没变。这样的话我觉得2028年，其实今年开始城市NOA基本上已经做到了脱手开，所以我说2028年可以做到百分之百脱手开是非常现实的。

脱手开是什么意思？我这个玩意也没有什么神奇，其实就是更高级的自动挡。20年前你开手动挡的车，离合器、踩油门、刹车，手忙脚乱；后来有了自动挡之后，基本上比较慢悠悠从容的方向盘搞搞，刹车、油门踩踩，其他不用管了。

2028年以后百分之百的脱手开，意思就是说眼睛看着前方就好了，其他什么都不用管，更高级的自动挡。我去年讲5年，今年讲4年，其实就是2030年，我认为那个时候L4自动驾驶应该实现了，你可以闭眼开，但是你不能睡觉，有的时候还是有一些脱困的能力，到2035年就可以随心开。

贾可：沈总，卓驭的L4级自动驾驶已经落地了，这是不是意味着用户现在直接可以“闭眼开”了？

沈劭劼：不好意思，关于这个问题，我可能还需要再确认和澄清一下。

贾可：我的核心问题是，自动驾驶演进的路径有没有比以前更令人乐观？因为现在的技术方向已经明确了，是不是意味着前景更加光明？我看卓驭的L4级技术确实已经上车了。

沈劭劼：明白。我的回答思路和凯哥有些类似。首先，大家通常都会问“多少年能达到脱手、脱眼”“什么时候能实现L3或L4”这类问题。我会说，这个时间节点是我们内部用来推动、激励团队的，而不是一个绝对的预判。

至于我对这个行业是乐观还是悲观，其实取决于技术范式。如果一个技术范式已经确定，且其潜力已经被我们完全榨干了，那我反而会非常悲观。就像当年我们做“分模块基于规则”的方案，从2005年的“DARPA无人驾驶挑战赛”一直做到2022年，近20年的时间里技术范式没有发生根本性变化，那个时候大家是很悲观的。

余凯：确实，那个时候感觉计算机视觉领域暗无天日。

沈劭劼：后来“端到端”技术出来了，我们乐观了一段时间。但随后发现完全端到端也有其瓶颈，大概到去年下半年时，大家的心态又从乐观转向了一点点悲观。

不过，后面我们发现真正的大模型能够解决这些问题，并且能看到它巨大的潜力。由于这个潜能目前还没有被挖尽，所以大家又变得乐观起来。

什么时候最让人乐观？恰恰是技术范式还在不断演进、充满变量的时候；而悲观，则是指技术已经没有突破和改变的空间了。

贾可：那现在这个节点，到底是悲观还是乐观？

沈劭劼：乐观。

贾可：乐观是因为你认为技术范式还没有完全固定下来？

余凯：他的意思是技术的潜力还没有挖尽，我们每个月都能看到技术上限在往上走。

贾可：也就是说，技术方向是确定的，但是技术能力还没有被榨干。

沈劭劼：是的。方向肯定是明确的，比如加强预训练、模型规模越来越大、引入世界模型等。方向很确定，但大家都还没有把这个方向的潜力挖掘干净，所以现在处于乐观期。

劝退车企盲目自研

贾可：搞自动驾驶每年要烧很多钱。你们每年大概要投入多少研发费用？

余凯：地平线去年研发费用投入了50多亿元。

沈劭劼：卓驭相对少一点，也是小几十个亿元的级别。光是算力交电费，我们就交了不止10亿元。

贾可：这确实非常依赖算力。你们相当于第三方的智驾公司。昨天小鹏汽车的董事长表示他们要坚持自研，蔚小理等新势力目前也都是自研，同时很多传统车企也想掌握自研能力。对于这些车企，你们能提点什么建议吗？

余凯：我觉得每个企业有自己的特质，成功的路径不止一条，企业一定要根据自己的特质去做擅长的事情。事实上，观察最近5年的行业发展，大量车企的自研其实是在收缩的，越来越多的人选择采用卓驭、元戎启行以及地平线等专业厂商的方案。

因为专业供应商是全力以赴只干这一件事。而对于车企来讲，本质上是要把车卖好、把产品做好。车企管理层要管供应链、生产制造，这非常复杂；还要思考车型和外形设计；以及内饰、车机、自动驾驶、软件、硬件等各个环节。甚至还要花很多精力去和宁德时代谈电池价格，去面对极其微薄的利润。此外，车企还要做渠道、用户运营、品牌搭建，车企老板现在甚至还要亲自当网红。

而这些繁杂的事务我们都不用管，我们只需要心无旁骛地把技术做好。我们的生意模式是自然存在的，这就是专业分工的力量。

其实今天很多车企并没有想明白一点：你今年可以投入10亿元、20亿元干自动驾驶，但这是一条开弓没有回头箭的路，因为距离L5级自动驾驶还很远。

那么明年你准不准备投40亿元？后年准不准备投60元亿？到了2030年，你敢不敢一年拿出150亿元砸在自动驾驶的研发上？对照车企自身的利润，有几家敢连续这样投入？

所以我觉得这不是今年干不干的“一锤子买卖”，核心在于未来5到10年你的战略定位究竟是什么。

贾可：你提到利润微薄，那你们现在赚钱了吗？

余凯：我们有充足的资金储备。我一年亏20亿元有什么关系？去年我投入50多亿元做研发，虽然账面亏损20亿元，但我账上还有200多亿元。

贾可：沈总，你怎么看？刚才凯哥说主机厂的利润太微薄了。

余凯：对地平线来讲，人工智能是一场世界级的产业革命，而地平线只聚焦做AI，我们不卖车。因此，在这个关键节点，如果我们在战略投入上表现得太小气，那将是最大的失误。

在这种时候，我们的核心战略就是要不计一切代价投入研发——当然，这必须是在有绝对健康的现金流支撑的前提下。

所以地平线的整个战略思考一直有两句话：第一句是刚才劭劼提到的，“在没有竞争的地方竞争”；第二句是“永远不在悬崖边跳舞”。

贾可：劭劼，你们是做移动物理AI基座的，实际不仅是在做自动驾驶，未来还要给具身智能赋能。刚才谈到车企要做自动驾驶，实际上很多车企跟小鹏汽车一样，未来也想做更多的事情，不仅想做汽车，还想做机器人。

现在中国很多车企都开始扎堆布局机器人和基站，可见他们非常有梦想。虽然现实很骨感，但他们想自己掌握底层能力。

如果市场上已经有了像卓驭这样提供移动物理AI基座的供应商，他们本身是不是就没必要重复造轮子了？就像凯哥说的那样。

沈劭劼：这背后核心还是看每个公司对自己最核心资产的投资决策。就像凯哥说的，每年投50个亿进去，能不能连续坚持投很多年？只要这个决策的答案是“YES”，其实都能做。

另外，每个公司必须想清楚自己核心护城河的定位。我们自己的定位其实就发生了一定的变化：曾经我们只是一个Tier 1，Tier 1的核心护城河是把交付与集成做好，这也是我们目前的基本盘，我们也做得挺好。但是再往后，随着模型逐渐变大、全面进入AI时代，我们必须从一家AI公司的角度去思考护城河。

现在这些大模型有一个典型特征：它不是通过切分垂类去解锁能力的。以往我们面临复杂问题，会把它简化为一个特定垂类去解决。但现在的AI是另一个方向，它是“以能力来解题”的。比如，知识型问答一个模型搞定，写代码一个模型搞定，视频生成一个模型搞定。这些大模型虽然不能跨界去做不相关的能力，但它可以做跨垂类的事情。

对于卓驭的思考也是一样，我们必须选择一个值得长期投入的“核心能力”去深耕，我们选择的是“移动”能力。所以我不断强调“移动物理AI”，把“移动”这两个字放进去了。起码现阶段我们聚焦于此，没说要做别的物理AI，也没有去做视频生成，这就是一种聚焦。

对于卓驭来说，这就是我们的全部。而对于不同垂类的业务拓展（比如拓展到重卡或物流领域），它可能只占我每年整体研发投入很少的一部分，我就能够顺便拓展出去，那我为什么不做呢？

贾可：凯哥，地平线是做舱驾融合一体化芯片的，从智驾延伸到了座舱，这个业务逻辑是不是要把汽车真正当成一个机器人的概念去打造？

余凯：对，我就是把汽车当作一个机器人来做。未来，座舱交互和智驾执行一定是不可分割的。机器人除了让它干活，你也需要和它交流。因此，座舱主要负责交互，智驾主要负责执行。从长远来看，机器人的操作系统跟芯片天然就需要舱驾融合。

贾可：地平线做“地瓜”也是在做机器人，这两个能力未来都可以给主机厂赋能。如果主机厂也想做机器人，你们完全可以支持。

余凯：当然可以。

贾可：所以你还是劝他们自己别硬干这个事。

余凯：我跟你讲，口头劝是没有用的。现在中国车企的每个老板都想成为下一个马斯克。这帮兄弟全都是我的好朋友，我有时跟他们说：“你不要去学马斯克，你当不了，这样不厚道。”

但开个玩笑之外，我觉得每个人的梦想都是应该被鼓励和赞赏的。我只是泛泛而论，从产业终局来看，能够成为马斯克的老板肯定是极少数。早晚有一天，每个人都要回过头来思考，如何做独特的自己。

贾可：由于时间关系，最后一个问题请每位简单回答一下。这个问题不难，也不会为难大家：当前整个行业正在加速收敛，第三方的自动驾驶公司在急剧减少，未来主机厂也必然会面临收敛和洗牌。

余凯：我还要补充一点：第三方自动驾驶公司的技术实力，正在迅速赶上并超过大部分主机厂的自研智驾能力，这也是事实。

贾可：这个范围包括小鹏汽车吗？

余凯：小鹏在自研里还蛮厉害的。

贾可：我想请教两位的核心问题是：你觉得第三方智驾公司在中国市场最终能留下来几家？我不用你们说具体名字，就猜个数量，比如3家还是5家？

余凯：这种拷问在行业内其实没有太大意义。

贾可：有意义，我没有让你指名道姓，只是问个大致的数量。

余凯：这几年你在台上问过很多车厂老板“未来还能剩几家”，有人说10家，有人说5家。这些答案说了和没说其实没有区别，现在台上不依然还有那么多家吗？我觉得用户不会去记住这些数字。

一个企业关键还是要找准自己的定位。这个世界上，任何一家企业都吃不下全世界的市场，我认为企业如果有这种“通吃”的想法，本身就是一种妄念。比如苹果公司之所以能成为苹果，并不是因为他们吃掉了所有人，而是因为他们只关心产品、只关心价值，而不去关心怎么把对手干死。

所以我觉得在这个舞台上，中国的企业千万不要有太重的极端竞争思维，而是要做独特的自己，要想清楚自己到底在这个产业里面扮演什么样的角色、能给用户创造什么价值。

贾可：这确实是极高的境界，但现实中大家依然在激烈竞争。劭劼，你可不要被他带偏了，你来说一下具体看好几家？

沈劭劼：他没有带偏我，我的想法其实和他差不多。企业只要定好自己的位。对我而言，只要能保证每年有200%到300%的出货量增长率，同时自己账上的现金流足够安全，有了这两点支撑，我好像就没有什么别的好担心的了。

贾可：好的，通过刚才与两位的深度交流，我们对行业的未来还是非常有信心的。正如凯哥所说，最重要的是做好自己，做有价值的事情。如果每天干的事情是有价值的，你自然就会有信心；如果你每天干的事情连自己都觉得没有价值，那就真的没有未来了。

感谢凯哥，感谢劭劼，也感谢在座的各位。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

贾可对话余凯、沈劭劼：物理AI潮下，谁能活下来？