2026-05-22 21:20

拆解蔚小理的数字游戏，智驾芯片到底该看什么？

电动星球News©

本文来自微信公众号：电动星球，作者：毓肥

过去一周，围绕智能驾驶芯片、围绕蔚小理英伟达华为特斯拉等等智能汽车企业的论战，再起硝烟。

一方面依然围绕最显而易见、消费者感知最强的算力本身——「稀疏算力」、「稠密算力」和「加倍稀疏算力」的弯弯绕绕，一石激起千层浪。

另一方面，则是有关算力以外的边缘参数，比如内存位宽、内存容量、ISP性能，等等。一如汽油机时代除了马力，大家还会争论衬套、悬架、防倾杆、方向盘手感一样，各种参数堆叠之下，方能完整映照性能。

作为消费者，如何在厂商的销售话术体系内，精准判断什么才是自己想要的，什么又是雾里看花的数据？

2026年的智驾芯片仍未有定式，但我们可以根据目前的战局，简单聊聊大家该如何看待现阶段智能驾驶的硬件「斗蛐蛐」。

首先，我们简单总结了蔚小理最新一代自研智驾芯片的具体参数，大家可以简单参考，然后开启今天的文章。

算力迷雾

首先当然是算力本身，聚焦2026年，中高端智能驾驶系统的算力已经迈向四位数，也就是超过1000TOPS。

遥想2017年，全球最先进的量产辅助驾驶芯片Mobileye EyeQ4H，单芯片算力只有5TOPS，9年时间智能汽车已经以近百倍速度发展。

但算力与算力之间也有鸿沟，此1000TOPS不一定比彼500TOPS强。

譬如「精度」，就应该是最关键的，配平各家算力的前缀。

首先，所谓的「算力」是怎么得出的？它可以简单理解为「一颗芯片跑特定难度的软件有多快」。

举个例子，英伟达向个人AI开发者出售的套件Jetson Thor，它的官方页面就标注了「2070 TFLOPS」算力，但同时有后缀「FP4-Sparse」（FP4稀疏）。

这意味着Jetson Thor的2070T算力，是在跑FP4精度的软件时得到的「速度值」，如果它跑int8、FP16等等更高精度的软件，就会得到一个更慢的速度，以一个更小的数字呈现。

而智能汽车上使用的Thor-U芯片，目前传播的700TOPS算力，则是在int8精度下推理得到的结果。

同样地，蔚来神玑的「一颗顶四颗」、理想马赫的1280TOPS、小鹏图灵的750TOPS，甚至特斯拉、华为、地平线们，如果脱离了具体的推理精度，是无法一起比较的。

我们同时询问了蔚小理的官方人士，蔚来方面表示，神玑的推理算力是基于int8精度得到的。

小鹏方面则表示，目前还没有对外公布图灵芯片的实际推理精度。而截止发稿，理想汽车并未明确向我们回复马赫100芯片的实际推理精度。

内存瓶颈

如果说峰值算力代表着一颗芯片的理论天花板，那么厂商给智驾芯片配备的运行内存总量，则代表着芯片可以实际发挥多少性能的「木桶最短板」。

我们可以把运行内存简单理解为「一条流水线可以容纳的工人总量」，而算力则代表着「你请了多少工人」。

假设我请了100万工人，兴高采烈地宣布，我要建成全世界工人总数最多的工厂。

但实际上，我手里只有一条可以同时容纳1000人同时工作的流水线，那么我实际的产出，并不会比请了1000名工人，同时流水线上有1000个工位的工厂高。

理解了这个概念之后，我们可以代入智驾芯片的实际工况中。比如，理想马赫、小鹏图灵、英伟达Thor-U，内存带宽都是273GB/s。

目前业内主流的辅助驾驶大模型参数量，其实还远低于豆包千问们的lite小模型，只有3-5B的大小。

我们取平均值，一个4B参数量的大模型，以int8精度推理，那么在273GB/s的内存带宽下，它将会实现每个token 14.65ms的时延。

对于辅助驾驶推理来说，每个token就可以简单理解为输出到方向盘/踏板上的「结果」。

1秒钟有1000毫秒，也就是每秒钟足够这样一个大模型运行68次，也就是68HZ的「刷新率」，如果每次推理结果都可用，那么已经远超30HZ的车规级推理刷新率要求了。

也正因如此，Orin X 205GB/s的带宽，承担目前4B左右的大模型参数量，已经摸到它的内存带宽瓶颈了，曾经的廉颇也吃不下越来越大碗的饭。

然后我们可以反过来，同样满足30HZ车规级要求的情况下，也可以推断出，特定的内存带宽，可以满足多大参数量的模型。

比如，如果用同样的位宽、int8精度反算，那么马赫、图灵、Thor-U都可以实现车端跑9B参数量大模型的要求，比4B还是大了一倍多。

至于蔚来神玑，因为它是目前量产内存带宽极高的智能驾驶芯片（546GB/s），所以第一，同样参数量的推理时延更低，其次，它理论上可以承载的模型更大。

按照上面同样的算法，4B参数+int8精度推理，神玑9031的内存系统理论上可以实现7.325ms的推理时延，可以承载18B的大模型参数量。

大家应该注意到，我们聊写内存的篇幅明显更长。

因为对于智能驾驶推理来说，内存明显会比算力更早遇到瓶颈，业界称这种现象为「memory wall内存墙」。

再举个例子，上面算出来神玑9031的带宽，足以承受最高18B参数的大模型以车规级刷新率进行数据传输。

那么倒过来，同样级别的数据传输，按照int8精度计算，实际只需要起步276TOPS的算力，就可以支撑计算需求。

当然实际上在不同传感器融合的过程中，算力不能简单理解为一根筋或者两头堵，但这也足以说明，算力已经远不是一套智能驾驶的瓶颈了，内存问题比算力更紧急。

而像这样有点反直觉的事实，智驾芯片里面还有很多。

ISP？这是啥？

除了内存，还有一个非常影响智驾芯片性能发挥的部件，甚至重要性完全不比推理算力差——ISP。

ISP全称image signal processor图像信号处理器，摄像头感光元件CMOS将物理世界信息记录成原生RAW数据，ISP则将原生数据进行降噪、调色、调节动态范围、编码，输出成我们人眼可以识别的图像信息。

熟悉特斯拉的朋友一定记得，马斯克是个坚决的「反ISP」人士。

马斯克一直认为，ISP本身会导致数据传递的延迟和失真。所以在目前特斯拉车型使用的AI 4方案上，他已经大刀阔斧地砍掉了摄像头端的ISP，仅保留AI 4芯片内置的ISP，尽可能减少视觉数据传递过程中的损失。

到了下一代AI 5，马斯克更是宣称彻底干掉ISP，直接让AI 5 2500TOPS算力的强大NPU「硬算」原始图像数据的色彩变换，彻底实现「从光子到踏板」的无缝端到端。

但回到蔚小理英伟达们，ISP依然是目前的主力，甚至正在不断成长。

譬如神玑9031，就拥有算力极高的智驾芯片ISP，6.5G Pixel/s相当于每秒处理65亿像素的视频数据，拆成3840x2160的4K画幅，也相当于26个摄像头的30HZ视频流。

另一方面，英伟达Thor-U的ISP算力，也从Orin X的1.8G翻倍至3.5GPixel/s，所以大家可以看到，搭载Thor方案的车型们，普遍都拥有更高像素的车内外摄像头。

小鹏也在图灵芯片中针对优化了ISP能力，尽管没有公布实际像素算力，但双独立ISP的设计，以及24路摄像头的接入能力，也可以看出小鹏依然走在优化极限场景兜底能力的道路上。

聊到极限场景，除了像素量，「bit」色彩位深也是至关重要的corner case兜底利器。

我们以「从黑到白」的色彩变化过程，来理解「色彩位深」的概念。

假设某家芯片厂宣传他们的ISP拥有8bit位深，那就意味着从纯黑到纯白，他们的ISP可以实现2的8次方，也就是256个等级的「位深」，可以理解为过渡了256个台阶，才从纯黑到纯白。

譬如蔚来神玑9031的ISP色彩位深是26bit，这意味着黑白之间可以理论上分离出67108864个「阶梯」，色彩过度更细腻，分离出的细节也会越多。

这就意味着，隧道夜晚这样的极限场景下，色彩位深更高的ISP，可以准确分离出环境的不同色彩要素，比如车牌、车灯、车身。

芯片宣传战的号角

聊到现在，可能也只是智驾芯片的冰山一角。

首先，对于个人消费者来说，影响购买决策和使用体验的芯片参数并不多，算力、带宽、ISP、内存大小，这些都是很直观的数字，更深层的功耗、扩展能力，理解门槛相对高，其次对于日常开车影响不大。

其次，我们正在见证中国车企、供应商的第一次芯片大爆发。产品层出不穷，宣传方式这正在摸索中。

可以预见地，中国智驾芯片的宣传战才刚刚开始。一些参数并不是某家厂商不愿意说，而可能是还没想好怎么说更劲爆。

而在纷繁的数字游戏中，消费者需要保持知情权的，不仅是不同领域的参数，更是统一的对比标准。

（完）

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI创投日报

频道：前沿科技