扫码打开虎嗅APP
出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|视觉中国
今天准备融资的梁文锋,已经不是一年前的那个梁文锋了。
4月17日晚,据悉,DeepSeek(深度求索)正以约100亿美元估值寻求新一轮融资,规模约3亿美元。而就在一年前,梁文锋还明确拒绝过VC投资,并对外表示“DeepSeek暂无融资计划”。对此,虎嗅向DeepSeek方面发送邮件进行核实,截至发稿未获回复。
“我现在还不清楚梁是否真的开始找VC了。”华映资本海外合伙人邱谆告诉虎嗅。邱谆常年往返于硅谷和国内,并长期关注AI与具身智能领域。
严格意义上,DeepSeek并不属于华映在海外的直接项目,但VC的目光几乎都聚焦在DeepSeek身上。邱谆非常清楚地知道DeepSeek正在面临的困境,但同时他也告诉我,“这不代表我们不会投他。”
短短一年,梁文锋的态度发生360度反转。
4月19日,社交媒体上又开始流传另一种说法:过去一年里,梁文锋曾先后见过马化腾与雷军,讨论融资的可能性。虽然真假尚未完全坐实,但传递出的信号已经非常明显了。对此,虎嗅也向腾讯方面求证,截至发稿,尚未得到回复。
那么问题来了,为什么时隔一年,这个一直以克制、低调著称的创始人,会从“拒绝融资”的态度,转变为主动接触资本?这中间究竟发生了什么?在笔者看来,这并不只是态度变化,更像是某种外部约束开始显性化。
一年前的梁文锋,几乎没有对手。架构与算法层面的连续突破,让DeepSeek一度被视为中国大模型体系中少数具备“自洽能力”的玩家之一,也在一定程度上加速了传统企业拥抱AI的进程。
但在某种程度上,也正是由于他过去突出的成绩,一时间被上百家国内外媒体称赞后,梁文锋几乎是被“捧杀”了。
过去一年,围绕DeepSeek的叙事开始出现裂缝。一方面,关于V4的发布时间,多次被外媒提前“预告”,却始终未能如期落地;另一方面,在这些报道中,延迟原因也被直接指向一个更现实的问题,即摆脱英伟达体系所带来的代价。
然而,节奏开始变慢,外部预期却没有下降。
同样是在过去这一年中,团队层面也出现波动:包括参与代码研究的郭达雅、LLM核心作者王炳宣、OCR核心作者魏浩然在内的多位关键人才相继离开。
从外部视角看,这家曾被寄予厚望的公司,似乎遇到难题了。
而就在这些复杂信号传出之后,融资的消息出现了。如果把上述这些故事线连接到一起,一个很显而易见的答案是,梁文锋是被逼着走到今天的。
那么,我们先做一个假设,如果梁文锋真的去VC寻求帮助,VC们会救他吗?
我得到的答案是肯定的。
DeepSeek被“捧杀”了:它最被赞赏的能力,正在成为最难调整的部分。
回看2025年春节,那个“年”是属于DeepSeek的。
R1发布之后,这家公司迅速被推到一个极高的位置:极致性价比、算法创新、国产替代路径等等。在一系列叙事叠加之下,DeepSeek也被推到了一个被人仰望的高度。
彼时,外界的共识是,DeepSeek在做的不仅是大模型,而是重写一套更便宜的AI基础设施。
但一年之后,这套叙事开始出现裂缝。
原本被认为会在2026年春节前后发布的新一代模型,却迟迟未能落地。外界几乎一致认为,关键卡点在于从依赖英伟达到摆脱这种依赖,这个过程很不顺利。
但DeepSeek曾经的优势,恰恰在于对英伟达强绑定。
与多数依赖规模堆叠的大模型不同,DeepSeek是从“效率”入手,通过一系列算法与工程优化,实现了接近SOTA水平的性能,同时大幅压低成本。例如,其提出的GRPO架构,本质上是对训练与推理效率的再设计。
但这种效率,并不是凭空出现的。一方面,在算力上,创始人梁文锋早年量化交易的积累,使其拥有远超一般创业公司的英伟达GPU资源;另一方面,在数据上,DeepSeek大量依赖对一流模型的蒸馏结果。
而真正关键的一步,在于底层工程。DeepSeek通过直接优化PTX编程,对GPU执行层进行改写,从而实现了对AI算力基础设施的系统性重构。
对此,华映资本海外合伙人邱谆对虎嗅解释道:“正是这一步,才让DeepSeek的‘性价比’能够实现。”
而问题也出在这里。PTX本质上是英伟达CUDA体系中的中间语言,是其生态的核心接口之一。这意味着,DeepSeek虽然在算法层实现了创新,但在基础设施层,却是高度绑定英伟达体系的。
也就是说,一旦尝试切换算力路径,例如转向国产芯片,问题就不再是“适配”,而是“重写”。
目前,大多数国产芯片厂商提供的是对CUDA生态的兼容方案,但对于已经深入PTX层优化的DeepSeek而言,这种兼容并不成立。底层代码、调度逻辑乃至整体工程体系,都需要重构。
换句话说,它的优势越深,迁移成本就越高。
这也解释了过去一年里的一些变化:模型节奏放缓、组织层面出现波动,以及部分核心人才的离开。从外部看,这些是现象,但背后指向的问题是:DeepSeek正在尝试摆脱一条曾经让它领先的路径。
这条路径,甚至让DeepSeek无法有机会与国内一流模型站在同一梯队。
邱谆是一位常年住在硅谷的投资人。他告诉虎嗅,包括OpenAI在内的公司,并不会在底层过度依赖PTX优化,其原因是,他们不希望被单一算力体系锁死。国内互联网厂商亦是如此,他们不会将自己赖以生存的业务都押注在英伟达算力体系之上的。
但DeepSeek已经走得太深了。
在过去一年,DeepSeek正在重写自己的底层代码,但这对他们来说,几乎是从0开始。
于是,才有了DeepSeek寻求融资的故事。
一位头部VC投资人告诉虎嗅,“融资并不会改变什么”。
原因已经很清楚了。从技术的角度来讲,这一切都是不可逆转的。尽管DeepSeek重写底层代码,试图适配国产芯片,性能也会大打折扣。
然而,从资本层面来看,这就是另一个故事了。“虽然我很清楚DeepSeek现在面临的问题,但这并不影响很多VC抢他们”。邱谆对虎嗅说道。
从大模型投资周期的角度来看,DeepSeek早就错过了这一风口。但即便这家公司是从0开始,即便已经错过风口,都不会影响VC入局。
“VC向来都是看人,而且VC本质上是一种‘冲动消费’。”邱谆告诉我。
不过,梁文锋的想法,依然阴晴不定。根据目前已上市的大模型公司来计算估值,DeepSeek的目标估值100亿美元并不高,甚至低于智谱、MiniMax和Kimi任意一家。
但还有一种可能是,如果按照梁文锋从去年不愿意融资到今年开放融资的想法来推测,也许是梁文锋本人并不愿意释放过多股份。
从这一角度来看,DeepSeek是否会融资,不确定性依然很高。
如果,梁文锋的目标是腾讯,也许融资后,对DeepSeek而言并不会发生太大变化,至少不会“伤筋动骨”;但倘若,他的目标是所有VC,那么也许DeepSeek会变成一家商业化公司,而这似乎并不符合这家公司的基因。
坠入“凡间”,就意味着DeepSeek要站在和Kimi、MiniMax、智谱、阶跃星辰一样的位置,成为新的“基模五强”。
过去一年,DeepSeek之所以被反复讨论,并不只是因为模型能力本身,而是因为它看起来“像一个例外”。
它用更少的钱,做出了接近甚至逼近SOTA的模型;它拒绝融资,在一轮资本狂热中保持克制;它强调效率,而不是规模。
这些都可以证明,DeepSeek从来没有走“既定路线”。
但现在,这个“例外”正在变得越来越难以维持。
但也许,梁文锋是想成为“凡人”的。因为就算是按照“既定路线”来判断这家公司,他也有着自己的独特优势:
首先,它是一家能做出创新的公司,这一点就已经非常难得;第二,DeepSeek并不缺钱,他寻求外界帮助,也许是想释放出另一种信号,甚至是身份上的转变。
从这种角度来看,融资意味着重新选择一条路径。
但如果,DeepSeek真的变成一家商业化公司,他就需要考虑一个他从前并不需要过分考虑的事情:它的模型能力如何转化为收入?
当然,DeepSeek可以用于梁文锋自己的幻方量化里,从而助力其他业务产生收入。但如果这样,DeepSeek还会是一家传统意义上的大模型公司吗?
似乎,DeepSeek正站在一个十字路口上。