扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-03-15 10:15

梁文峰和姚顺雨,四月交卷

本文来自微信公众号: 版面之外 ,作者:画画


2026年4月,中国AI圈将迎来一次罕见的同台竞技。


DeepSeek V4,梁文锋打磨已久的多模态大模型,计划正式上线。


几乎同一时间,腾讯混元新模型也将发布,负责人是姚顺雨,2025年底刚刚回国,顶着腾讯总办首席AI科学家的Title走马上任。


两家公司,一南一北,一个初创,一个巨头。


一个是用量化私募思路颠覆了AI行业的理工男,一个是被腾讯用最高规格从海外请回来的学术派。


他们几乎不可能在同一张牌桌上出现,但4月,他们都要交卷。


这不是巧合,这是一个节点。


1、腾讯的那个决定


要理解4月意味着什么,必须回到2025年初腾讯做的那个决定。


彼时国内大模型市场,百度有文心,阿里有通义,字节有豆包,各家都在跑马圈地。腾讯混元排不进第一梯队,产品端的元宝几乎没有存在感。


就在这个时候,腾讯选择在元宝里接入DeepSeek。


这个决定在当时被很多人解读为务实之举,与其死撑自研,不如先用最好的模型把用户留住。


但它同时也是一个承认:在大模型能力这件事上,我们现在不如一家创业公司。


元宝的数据验证了这个决定的正确性。


接入DeepSeek之后,用户和活跃度明显回升。这是腾讯用流量换了时间,用元宝已有的产品生态和微信QQ的导流能力,换来了姚顺雨团队自研模型的窗口期。


但时间窗口终究有限。一旦混元最新的版本上线,腾讯面临的第一个真实问题是:留在元宝里的用户,到底认的是哪个名字?


这不是能靠市场调研回答的问题,它只能靠4月之后的留存数据来回答。


2、DeepSeek的另一道难题


DeepSeek这边,面对的是一种完全不同性质的压力。


V3发布之后,DeepSeek的数字是这样的:上线至2025年2月9日,累计下载超过1.1亿次,周活跃用户最高接近9700万。


这个量级,已经接近Twitter在鼎盛期的日活水平,对于一个发布不到半年的AI应用,当时几乎没有先例。


更大的影响发生在行业层面。V3发布后,英伟达单日市值蒸发约6000亿美元,美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。


DeepSeek用一个开源模型,在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。


但这组数字和这段叙事,也同时变成了V4必须背负的重量。


市场对V4的预期,不是比V3更好,而是能不能再次重新定义。这是一个很难完成的任务,因为V3已经把天花板拉得很高。


梁文锋选择的应对方式,是让V4的迭代方向足够具体,而不是继续打效率革命的旗号。


从论文节奏看,这个准备早就开始了。


2025年12月,署名包含梁文锋团队的《mHC:Manifold-Constrained Hyper-Connections》发表,方向是底层架构的连接方式优化;


2026年1月,梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制,在推理过程中,模型可以根据条件动态检索和激活相关记忆,而不是把所有历史上下文都塞进一个固定窗口里。


这两篇论文,距离V4发布只有几个月。它们不是学术展示,更像是产品路线图的技术背书。


V4还有一条线被单独提出,深度适配国产芯片,并有望成为首个完全运行在国产算力生态上的顶级大模型。


在此之前,所有顶级大模型的训练和推理都高度依赖英伟达的GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距,适配工作远比听起来复杂。


如果V4真的跑通了,意味着中国大模型产业链上最关键的一环,算力依赖第一次出现了可被验证的替代路径。


3、两条路,同一个终点


有意思的是,DeepSeek和腾讯在技术路线上正在往同一个方向收拢:长上下文、长期记忆、Agent可用性。


这不是巧合,这是整个行业正在形成的共识。下一代AI竞争的核心,不再是谁的参数更多,而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。


但两家公司走向这个终点的路径截然不同。


DeepSeek的做法是从底层架构动刀,条件记忆机制是要在模型本身的记忆方式上做根本性改变。


腾讯的做法是先定义评测标准,CL-bench提出了一套衡量上下文学习能力的新基准。


如果这套标准被学术圈和行业接受,腾讯就获得了一个叙事上的主动权:你的模型好不好,要按我定的标准。


两种路径,代表了两种不同的竞争策略。做出更好的产品,和定义什么叫更好的产品,是两件事。


历史上,后者有时候比前者活得更久。但前提是,你定的标准得被别人接受。如果DeepSeek V4的能力直接碾压了CL-bench设定的评测维度,那套标准就只是腾讯的自我评分。


4、四月之后


4月会到来,两张考卷会被打开,市场会给出它的判断。


但真正值得追问的问题,比谁的模型更好要复杂得多。


第一个问题:腾讯能不能接住用户的切换?


从接入DeepSeek到推出自研混元,这条路如果走通,腾讯的体量、数据、场景接入,微信、QQ、腾讯视频、游戏、企业微信,一旦有了够用的底座,这些场景的价值才能被真正释放出来。


但如果切换之后用户留存下滑,腾讯可能需要重新评估自己在这场竞争里的位置。


第二个问题:DeepSeek能不能守住国产第一的位置?


V3之后,DeepSeek已经不只是一个产品,它是一个标准、一种叙事。


V4需要证明,这不是偶然,而是一种可持续的能力。


尤其是在国产芯片这条线上,如果跑通了,DeepSeek将拥有一个其他顶级大模型都没有的叙事,而这个叙事的价值,可能比模型本身还要大。


第三个问题,也是最大的问题:谁在争定义权?


大模型的下半场,不只是谁的能力更强,更是谁来定义下一代AI应该是什么样的。


梁文锋的答案是:开源、高效、记忆力强、跑在自己的芯片上。


姚顺雨和腾讯的答案是:深度融合场景、长上下文、Agent友好。这两个答案并不互斥,但代表了两种不同的路径,一个是从模型出发往应用走,一个是从应用出发往模型走。


4月,只是一个节点。真正的答案,可能需要整个2026年来慢慢揭晓。


但有一件事是确定的,2025年初,元宝接入DeepSeek的那一刻,是中国AI格局的一次重组,大公司第一次公开承认,创业公司在核心技术上跑到了前面。


2026年4月,如果混元和V4同时亮相,将是另一次重组的开始,不再是谁领先的问题,而是各自走哪条路的问题。


中国AI的故事,正在从赛跑变成分道。


而分道,往往比赛跑,更有意思。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: