原创

2026-04-20 07:17

梁文锋，坐不住了

宋思杭

出品｜虎嗅科技组

作者｜宋思杭

编辑｜苗正卿

头图｜视觉中国

今天准备融资的梁文锋，已经不是一年前的那个梁文锋了。

4月17日晚，据悉，DeepSeek（深度求索）正以约100亿美元估值寻求新一轮融资，规模约3亿美元。而就在一年前，梁文锋还明确拒绝过VC投资，并对外表示“DeepSeek暂无融资计划”。对此，虎嗅向DeepSeek方面发送邮件进行核实，截至发稿未获回复。

“我们也许已经在看了，但我现在还不清楚梁是否真的开始找VC了。”一位长期关注AI和具身智能领域的投资人告诉虎嗅。

DeepSeek已经让资本侧开始“躁动”。VC的目光几乎都聚焦在DeepSeek身上。尽管部分懂技术的投资人非常清楚地知道DeepSeek正在面临的困境，但同时他们也告诉我，“这不代表我们不会投他。”

短短一年，梁文锋的态度发生360度反转。

4月19日，社交媒体上又开始流传另一种说法：过去一年里，梁文锋曾先后见过马化腾与雷军，讨论融资的可能性。虽然真假尚未完全坐实，但传递出的信号已经非常明显了。对此，虎嗅也向腾讯方面求证，截至发稿，尚未得到回复。

那么问题来了，为什么时隔一年，这个一直以克制、低调著称的创始人，会从“拒绝融资”的态度，转变为主动接触资本？这中间究竟发生了什么？在笔者看来，这并不只是态度变化，更像是某种外部约束开始显性化。

一年前的梁文锋，几乎没有对手。架构与算法层面的连续突破，让DeepSeek一度被视为中国大模型体系中少数具备“自洽能力”的玩家之一，也在一定程度上加速了传统企业拥抱AI的进程。

但在某种程度上，也正是由于他过去突出的成绩，一时间被上百家国内外媒体称赞后，梁文锋几乎是被“捧杀”了。

过去一年，围绕DeepSeek的叙事开始出现裂缝。一方面，关于V4的发布时间，多次被外媒提前“预告”，却始终未能如期落地；另一方面，在这些报道中，延迟原因也被直接指向一个更现实的问题，即摆脱英伟达体系所带来的代价。

然而，节奏开始变慢，外部预期却没有下降。

同样是在过去这一年中，团队层面也出现波动：包括参与代码研究的郭达雅、LLM核心作者王炳宣、OCR核心作者魏浩然在内的多位关键人才相继离开。

从外部视角看，这家曾被寄予厚望的公司，似乎遇到难题了。

而就在这些复杂信号传出之后，融资的消息出现了。如果把上述这些故事线连接到一起，一个很显而易见的答案是，梁文锋是被逼着走到今天的。

那么，我们先做一个假设，如果梁文锋真的去VC寻求帮助，VC们会救他吗？

我得到的答案是肯定的。

被“捧杀”的DeepSeek

DeepSeek被“捧杀”了：它最被赞赏的能力，正在成为最难调整的部分。

回看2025年春节，那个“年”是属于DeepSeek的。

R1发布之后，这家公司迅速被推到一个极高的位置：极致性价比、算法创新、国产替代路径等等。在一系列叙事叠加之下，DeepSeek也被推到了一个被人仰望的高度。

彼时，外界的共识是，DeepSeek在做的不仅是大模型，而是重写一套更便宜的AI基础设施。

但一年之后，这套叙事开始出现裂缝。

原本被认为会在2026年春节前后发布的新一代模型，却迟迟未能落地。外界几乎一致认为，关键卡点在于从依赖英伟达到摆脱这种依赖，这个过程很不顺利。

但DeepSeek曾经的优势，恰恰在于对英伟达强绑定。

与多数依赖规模堆叠的大模型不同，DeepSeek是从“效率”入手，通过一系列算法与工程优化，实现了接近SOTA水平的性能，同时大幅压低成本。例如，其提出的GRPO架构，本质上是对训练与推理效率的再设计。

但这种效率，并不是凭空出现的。一方面，在算力上，创始人梁文锋早年量化交易的积累，使其拥有远超一般创业公司的英伟达GPU资源；另一方面，在数据上，DeepSeek大量依赖对一流模型的蒸馏结果。

而真正关键的一步，在于底层工程。DeepSeek通过直接优化PTX编程，对GPU执行层进行改写，从而实现了对AI算力基础设施的系统性重构。

对此，有长期关注DeepSeek的投资人对虎嗅解释道：“正是这一步，才让DeepSeek的‘性价比’能够实现。”

而问题也出在这里。PTX本质上是英伟达CUDA体系中的中间语言，是其生态的核心接口之一。这意味着，DeepSeek虽然在算法层实现了创新，但在基础设施层，却是高度绑定英伟达体系的。

也就是说，一旦尝试切换算力路径，例如转向国产芯片，问题就不再是“适配”，而是“重写”。

目前，大多数国产芯片厂商提供的是对CUDA生态的兼容方案，但对于已经深入PTX层优化的DeepSeek而言，这种兼容并不成立。底层代码、调度逻辑乃至整体工程体系，都需要重构。

换句话说，它的优势越深，迁移成本就越高。

这也解释了过去一年里的一些变化：模型节奏放缓、组织层面出现波动，以及部分核心人才的离开。从外部看，这些是现象，但背后指向的问题是：DeepSeek正在尝试摆脱一条曾经让它领先的路径。

这条路径，甚至让DeepSeek无法有机会与国内一流模型站在同一梯队。

徐明（化名）是一位常年住在硅谷的投资人。他告诉虎嗅，包括OpenAI在内的公司，并不会在底层过度依赖PTX优化，其原因是，他们不希望被单一算力体系锁死。国内互联网厂商亦是如此，他们不会将自己赖以生存的业务都押注在英伟达算力体系之上的。

但DeepSeek已经走得太深了。

在过去一年，DeepSeek正在重写自己的底层代码，但这对他们来说，几乎是从0开始。

VC一直在等梁文锋

于是，才有了DeepSeek寻求融资的故事。

一位头部VC投资人告诉虎嗅，“融资并不会改变什么”。

原因已经很清楚了。从技术的角度来讲，这一切都是不可逆转的。尽管DeepSeek重写底层代码，试图适配国产芯片，性能也会大打折扣。

然而，从资本层面来看，这就是另一个故事了。“虽然我很清楚DeepSeek现在面临的问题，但这并不影响很多VC抢他们”。一位投资人对虎嗅说道。

从大模型投资周期的角度来看，DeepSeek早就错过了这一风口。但即便这家公司是从0开始，即便已经错过风口，都不会影响VC入局。

“VC向来都是看人，而且VC本质上是一种‘冲动消费’。”一位AI领域的投资人告诉我。

不过，梁文锋的想法，依然阴晴不定。根据目前已上市的大模型公司来计算估值，DeepSeek的目标估值100亿美元并不高，甚至低于智谱、MiniMax和Kimi任意一家。

但还有一种可能是，如果按照梁文锋从去年不愿意融资到今年开放融资的想法来推测，也许是梁文锋本人并不愿意释放过多股份。

从这一角度来看，DeepSeek是否会融资，不确定性依然很高。

如果，梁文锋的目标是腾讯，也许融资后，对DeepSeek而言并不会发生太大变化，至少不会“伤筋动骨”；但倘若，他的目标是所有VC，那么也许DeepSeek会变成一家商业化公司，而这似乎并不符合这家公司的基因。

DeepSeek会坠入“凡间”吗？

坠入“凡间”，就意味着DeepSeek要站在和Kimi、MiniMax、智谱、阶跃星辰一样的位置，成为新的“基模五强”。

过去一年，DeepSeek之所以被反复讨论，并不只是因为模型能力本身，而是因为它看起来“像一个例外”。

它用更少的钱，做出了接近甚至逼近SOTA的模型；它拒绝融资，在一轮资本狂热中保持克制；它强调效率，而不是规模。

这些都可以证明，DeepSeek从来没有走“既定路线”。

但现在，这个“例外”正在变得越来越难以维持。

但也许，梁文锋是想成为“凡人”的。因为就算是按照“既定路线”来判断这家公司，他也有着自己的独特优势：

首先，它是一家能做出创新的公司，这一点就已经非常难得；第二，DeepSeek并不缺钱，他寻求外界帮助，也许是想释放出另一种信号，甚至是身份上的转变。

从这种角度来看，融资意味着重新选择一条路径。

但如果，DeepSeek真的变成一家商业化公司，他就需要考虑一个他从前并不需要过分考虑的事情：它的模型能力如何转化为收入？

当然，DeepSeek可以用于梁文锋自己的幻方量化里，从而助力其他业务产生收入。但如果这样，DeepSeek还会是一家传统意义上的大模型公司吗？

似乎，DeepSeek正站在一个十字路口上。

本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。

AI创投日报

频道：前沿科技