扫码打开虎嗅APP
本文来自微信公众号: 电动星球 ,作者:毓肥
过去一周,围绕智能驾驶芯片、围绕蔚小理英伟达华为特斯拉等等智能汽车企业的论战,再起硝烟。
一方面依然围绕最显而易见、消费者感知最强的算力本身——「稀疏算力」、「稠密算力」和「加倍稀疏算力」的弯弯绕绕,一石激起千层浪。
另一方面,则是有关算力以外的边缘参数,比如内存位宽、内存容量、ISP性能,等等。一如汽油机时代除了马力,大家还会争论衬套、悬架、防倾杆、方向盘手感一样,各种参数堆叠之下,方能完整映照性能。
作为消费者,如何在厂商的销售话术体系内,精准判断什么才是自己想要的,什么又是雾里看花的数据?
2026年的智驾芯片仍未有定式,但我们可以根据目前的战局,简单聊聊大家该如何看待现阶段智能驾驶的硬件「斗蛐蛐」。
首先,我们简单总结了蔚小理最新一代自研智驾芯片的具体参数,大家可以简单参考,然后开启今天的文章。

首先当然是算力本身,聚焦2026年,中高端智能驾驶系统的算力已经迈向四位数,也就是超过1000TOPS。
遥想2017年,全球最先进的量产辅助驾驶芯片Mobileye EyeQ4H,单芯片算力只有5TOPS,9年时间智能汽车已经以近百倍速度发展。
但算力与算力之间也有鸿沟,此1000TOPS不一定比彼500TOPS强。
譬如「精度」,就应该是最关键的,配平各家算力的前缀。
首先,所谓的「算力」是怎么得出的?它可以简单理解为「一颗芯片跑特定难度的软件有多快」。
举个例子,英伟达向个人AI开发者出售的套件Jetson Thor,它的官方页面就标注了「2070 TFLOPS」算力,但同时有后缀「FP4-Sparse」(FP4稀疏)。
这意味着Jetson Thor的2070T算力,是在跑FP4精度的软件时得到的「速度值」,如果它跑int8、FP16等等更高精度的软件,就会得到一个更慢的速度,以一个更小的数字呈现。
而智能汽车上使用的Thor-U芯片,目前传播的700TOPS算力,则是在int8精度下推理得到的结果。
同样地,蔚来神玑的「一颗顶四颗」、理想马赫的1280TOPS、小鹏图灵的750TOPS,甚至特斯拉、华为、地平线们,如果脱离了具体的推理精度,是无法一起比较的。
我们同时询问了蔚小理的官方人士,蔚来方面表示,神玑的推理算力是基于int8精度得到的。
小鹏方面则表示,目前还没有对外公布图灵芯片的实际推理精度。而截止发稿,理想汽车并未明确向我们回复马赫100芯片的实际推理精度。
如果说峰值算力代表着一颗芯片的理论天花板,那么厂商给智驾芯片配备的运行内存总量,则代表着芯片可以实际发挥多少性能的「木桶最短板」。
我们可以把运行内存简单理解为「一条流水线可以容纳的工人总量」,而算力则代表着「你请了多少工人」。
假设我请了100万工人,兴高采烈地宣布,我要建成全世界工人总数最多的工厂。
但实际上,我手里只有一条可以同时容纳1000人同时工作的流水线,那么我实际的产出,并不会比请了1000名工人,同时流水线上有1000个工位的工厂高。
理解了这个概念之后,我们可以代入智驾芯片的实际工况中。比如,理想马赫、小鹏图灵、英伟达Thor-U,内存带宽都是273GB/s。
目前业内主流的辅助驾驶大模型参数量,其实还远低于豆包千问们的lite小模型,只有3-5B的大小。
我们取平均值,一个4B参数量的大模型,以int8精度推理,那么在273GB/s的内存带宽下,它将会实现每个token 14.65ms的时延。
对于辅助驾驶推理来说,每个token就可以简单理解为输出到方向盘/踏板上的「结果」。
1秒钟有1000毫秒,也就是每秒钟足够这样一个大模型运行68次,也就是68HZ的「刷新率」,如果每次推理结果都可用,那么已经远超30HZ的车规级推理刷新率要求了。
也正因如此,Orin X 205GB/s的带宽,承担目前4B左右的大模型参数量,已经摸到它的内存带宽瓶颈了,曾经的廉颇也吃不下越来越大碗的饭。
然后我们可以反过来,同样满足30HZ车规级要求的情况下,也可以推断出,特定的内存带宽,可以满足多大参数量的模型。
比如,如果用同样的位宽、int8精度反算,那么马赫、图灵、Thor-U都可以实现车端跑9B参数量大模型的要求,比4B还是大了一倍多。
至于蔚来神玑,因为它是目前量产内存带宽极高的智能驾驶芯片(546GB/s),所以第一,同样参数量的推理时延更低,其次,它理论上可以承载的模型更大。
按照上面同样的算法,4B参数+int8精度推理,神玑9031的内存系统理论上可以实现7.325ms的推理时延,可以承载18B的大模型参数量。
大家应该注意到,我们聊写内存的篇幅明显更长。
因为对于智能驾驶推理来说,内存明显会比算力更早遇到瓶颈,业界称这种现象为「memory wall内存墙」。
再举个例子,上面算出来神玑9031的带宽,足以承受最高18B参数的大模型以车规级刷新率进行数据传输。
那么倒过来,同样级别的数据传输,按照int8精度计算,实际只需要起步276TOPS的算力,就可以支撑计算需求。
当然实际上在不同传感器融合的过程中,算力不能简单理解为一根筋或者两头堵,但这也足以说明,算力已经远不是一套智能驾驶的瓶颈了,内存问题比算力更紧急。
而像这样有点反直觉的事实,智驾芯片里面还有很多。
除了内存,还有一个非常影响智驾芯片性能发挥的部件,甚至重要性完全不比推理算力差——ISP。
ISP全称image signal processor图像信号处理器,摄像头感光元件CMOS将物理世界信息记录成原生RAW数据,ISP则将原生数据进行降噪、调色、调节动态范围、编码,输出成我们人眼可以识别的图像信息。
熟悉特斯拉的朋友一定记得,马斯克是个坚决的「反ISP」人士。
马斯克一直认为,ISP本身会导致数据传递的延迟和失真。所以在目前特斯拉车型使用的AI 4方案上,他已经大刀阔斧地砍掉了摄像头端的ISP,仅保留AI 4芯片内置的ISP,尽可能减少视觉数据传递过程中的损失。
到了下一代AI 5,马斯克更是宣称彻底干掉ISP,直接让AI 5 2500TOPS算力的强大NPU「硬算」原始图像数据的色彩变换,彻底实现「从光子到踏板」的无缝端到端。
但回到蔚小理英伟达们,ISP依然是目前的主力,甚至正在不断成长。

譬如神玑9031,就拥有算力极高的智驾芯片ISP,6.5G Pixel/s相当于每秒处理65亿像素的视频数据,拆成3840x2160的4K画幅,也相当于26个摄像头的30HZ视频流。
另一方面,英伟达Thor-U的ISP算力,也从Orin X的1.8G翻倍至3.5GPixel/s,所以大家可以看到,搭载Thor方案的车型们,普遍都拥有更高像素的车内外摄像头。

小鹏也在图灵芯片中针对优化了ISP能力,尽管没有公布实际像素算力,但双独立ISP的设计,以及24路摄像头的接入能力,也可以看出小鹏依然走在优化极限场景兜底能力的道路上。
聊到极限场景,除了像素量,「bit」色彩位深也是至关重要的corner case兜底利器。
我们以「从黑到白」的色彩变化过程,来理解「色彩位深」的概念。
假设某家芯片厂宣传他们的ISP拥有8bit位深,那就意味着从纯黑到纯白,他们的ISP可以实现2的8次方,也就是256个等级的「位深」,可以理解为过渡了256个台阶,才从纯黑到纯白。
譬如蔚来神玑9031的ISP色彩位深是26bit,这意味着黑白之间可以理论上分离出67108864个「阶梯」,色彩过度更细腻,分离出的细节也会越多。
这就意味着,隧道夜晚这样的极限场景下,色彩位深更高的ISP,可以准确分离出环境的不同色彩要素,比如车牌、车灯、车身。
聊到现在,可能也只是智驾芯片的冰山一角。
首先,对于个人消费者来说,影响购买决策和使用体验的芯片参数并不多,算力、带宽、ISP、内存大小,这些都是很直观的数字,更深层的功耗、扩展能力,理解门槛相对高,其次对于日常开车影响不大。
其次,我们正在见证中国车企、供应商的第一次芯片大爆发。产品层出不穷,宣传方式这正在摸索中。
可以预见地,中国智驾芯片的宣传战才刚刚开始。一些参数并不是某家厂商不愿意说,而可能是还没想好怎么说更劲爆。
而在纷繁的数字游戏中,消费者需要保持知情权的,不仅是不同领域的参数,更是统一的对比标准。
(完)