
本文来自微信公众号: 中国企业家杂志 ,作者:陈浩,原文标题:《500亿,梁文锋“不学”任正非了|一周人物》
6月3日,据媒体援引消息人士称,DeepSeek预计将在其首轮融资中筹集约500亿元(约合74亿美元),该公司的估值可能在3500亿至4000亿元(合520亿至590亿美元)之间。而DeepSeek创始人梁文锋已承诺投入200亿元自有资金,腾讯、宁德时代正分别考虑投资100亿元、50亿元,或将成为本轮融资中最大的两个外部投资者。
消息人士还表示,DeepSeek正在与国家级人工智能基金、网易、京东等进行最后阶段的洽谈,IDG资本和Monolith Capital也在潜在投资者之列。计划中的投资者数量少于10家,预计数周内敲定,但具体条款仍可能变化。截至发稿,相关方均未对此交易有所回应。
梁文锋还是变了。
可以说,他是过去两年中国AI圈里“不变”的坚定代表,当同行纷纷融资、上市、抢用户、拼商业化的时候,他静如处子。业内人士评价DeepSeek像研究机构:不设KPI、不赶Deadline(最后期限)、研究员下午六点多就下班。这背后是据传管理规模超700亿元、一年利润约50亿元的幻方量化(梁文锋旗下的量化对冲基金公司,以下简称“幻方”),在持续输血。
2025年初R1版本发布,“DeepSeek时刻”一度引发英伟达等AI、芯片巨头股价的剧烈震荡。随后,梁文锋被《Nature》评为2025年度十大科学人物。《Nature》称,与模型的高度开放形成对比,这位企业家本人极其低调,“他拒绝了采访请求”。
彼时的他,态度明确——短期内没有融资计划,DeepSeek面临的问题从来不是钱,而是高端芯片。而如今,他亲手推翻了这句话。
梁文锋1985年生于广东湛江吴川,父亲是小学教师。据报道,他童年里会反复拆装一台收音机,那股死磕细节的劲头一直留到现在。少年时,他数学出众,进入浙江大学读电子信息工程,研究生阶段做机器视觉;毕业后,他没有去大厂,而是一头扎进当时还冷门的量化投资领域。
2013年,他与校友徐进创办杭州雅克比投资管理公司,2015年又共同创立幻方,班底多为来自浙江大学的同侪。据报道,公司长期把约七成年收入投向研发与人才,十年间,幻方一度做到了千亿元资金管理规模。
早在2019年,幻方就投入近2亿元自研深度学习训练平台“萤火一号”,搭载约1100块GPU;两年后又斥资10亿元上线“萤火二号”,搭载约1万张英伟达A100 GPU。据报道,彼时国内拥有超过一万枚GPU的企业不超过五家,除幻方外都是互联网大厂,单看算力,这家量化公司更早拿到了做AI的入场券。
2023年,38岁的梁文锋决定“All in”AI。那一年,ChatGPT横扫全球,国内的普遍共识是没有数万张高端显卡、百亿元级别投入,做不出顶级大模型,与其追赶,不如去做应用。他带着一支百余人的本土团队入场,而当时OpenAI已经有约1200名研究人员,Anthropic有500多名。同年7月,DeepSeek成立,第一期研发由幻方自主出资约30亿元。
梁文锋从一开始就选择了“未被选择”的路——极致低成本、全面开源。
2024年5月,V2版本以创新架构把API价格压到每百万tokens输入1元、输出2元,约为GPT-4 Turbo的百分之一;2025年1月的R1版本,据其论文显示,训练成本约29.4万美元、构建基础模型约600万美元,却做出了媲美顶尖闭源模型的推理能力,并随即全面开源。
在《暗涌》的专访里,梁文锋把自己的逻辑讲得很透:“封闭技术是筑墙,开源才是建桥”。他也警惕用钱砸出来的领先,“一味堆砌算力是饮鸩止渴”,如果提高5%的性能要付出10倍成本,在他看来“就是不道德的创新”。
这套理念,落到组织上是一种近乎“无为”的管理。DeepSeek没有KPI,也几乎没有固定团队、汇报关系和年度计划;战略按周迭代,研究员可以不经审批调用训练集群的卡、按兴趣自由组队。梁文锋相信“创新首先是一个信念问题,首先是敢”,而这种自信“在年轻人身上更明显”。
支撑这种纯粹的,是他对公司的绝对控制。天眼查显示,4月末,杭州深度求索人工智能基础技术研究有限公司(DeepSeek的运营主体)注册资本由1000万元增至1500万元。其中,梁文锋认缴出资增加500万元至510万元,直接持股比例由1%升至34%。调整后,他通过直接与间接方式合计控制超80%的股权,业内人士把这种控制称作他“保护理想的防火墙”。
而在首轮对外融资中,他个人出资的200亿元,看上去又要在这个估值区间里拥有主导对话的权利。从这一点看,梁文锋其实也没变,变的是行业环境、竞争规则和DeepSeek所处的阶段。
从横空出世那一天起,外界就惊讶于他的独特:不融资、不站队,不靠大厂输血,却偏偏走在开源、低价、国产替代这几条最难的路上。媒体乐于把他称作“下一个任正非”——同样深居简出,同样攥紧公司控制权,也始终不惧怕“华山一条路”。
但时代终究不同了。华为可以不上市、不引入资本,而DeepSeek面对的,是巨头已经跑起来的速度。梁文锋撕开的或许是一道“纸枷锁”,这未必是妥协。只是那条极具浪漫主义的路径,走到了今天,他确实该换一副铠甲了。

变量
2024年底,DeepSeek的V3版本发布前后,一则热搜把这家低调的公司推到了风口浪尖。
据传,小米创始人雷军亲自下场,开出千万元年薪,要把DeepSeek研究员罗福莉挖去执掌小米的大模型团队。罗福莉是北京大学计算语言学硕士,读研时就以一年八篇顶会论文成名,后来从阿里达摩院转投幻方、再到DeepSeek,参与了V2版本的研发。
几乎一夜之间,“AI天才少女”的标签贴满全网。数月以后,她在凌晨发了条朋友圈:“请互联网还我一片安安静静做事的氛围吧……我并非什么天才少女,神化一个人的结果就是捧得多高、摔得多重。”她说,自己只想做“难而正确的事”。
罗福莉不是个例,从2025年下半年起,DeepSeek几乎成了同行的“猎场”。
提出R1版本核心算法GRPO的郭达雅去了字节跳动的Seed团队、第一代大语言模型的核心作者王炳宣加盟腾讯混元、多模态负责人阮翀去了元戎启行、OCR核心魏浩然也已离开……他们大多是DeepSeek历代模型论文上的署名者,是把这家公司送上神坛的那批人。
挖墙脚的筹码很直白。据报道,大厂为单个核心研究员开出的薪资总包可达数千万元乃至上亿元。“以前都说大模型拼数据、算法、算力,现在看,到最后拼的是人。”很多从业者的这句感慨,DeepSeek应该体会得最深。
2025年底以来,这家以研究著称的公司也开始“开闸式”招聘产品经理、搭建数个创新产品团队,探索Agent与C端产品形态。
而梁文锋手里没有能跟大厂对标的筹码——没有成熟的期权就留不住人,而要把期权发出去、给团队份额重新定价,融资几乎是唯一的出口。
除了留人,算力更是“吞金兽”。
DeepSeek早年那些“低成本奇迹”,很大程度上是用幻方囤下的那批显卡喂出来的。但是在新的环境下,存货显然不够用。据多家媒体报道,新旗舰产品V4版本要把训练和推理从英伟达耕耘了二十年的CUDA生态,整体搬到华为昇腾的CANN体系上。这意味着底层代码近乎重写,单轮训练成本据称超过5亿美元。
最受期待的R2版本迟迟不来,也被认为是性能还没达到预期。被推上“国产软硬协同”试验场的DeepSeek,2026年初拿出的mHC架构,又一次试图以算法上的原创去抵消算力上的劣势。但很长一段时间内,外界显然感受到了它的“吃力”。
把时间往回拨,DeepSeek原本只是幻方的一条AI“副线”。2024年5月,它把API价格一路打到每百万tokens输入1元、输出2元,当月就逼得大厂纷纷跟进,掀起一场持续半年多的价格战,“价格屠夫”“AI界拼多多”的名号由此而来。当年底的V3版本,又用不到GPT-4十分之一的训练成本,做出了能与全球一线同台比较的模型,把只有少数美国巨头才玩得起大模型的叙事撕开了一道口子。
可两年过去,情况全变了。据报道,2025年8月豆包的月活已达1.57亿,反超DeepSeek。而2026年被多家媒体称作中国AI的“大年”,春节前后,豆包、千问、元宝与DeepSeek齐齐冲进月活过亿,而新模型产品还在接连登场。
有分析师把2025年末视作一道分水岭:那些算力与生态深厚的巨头,对DeepSeek们发起了全面反攻,比拼从“单点技术突破”转向“全栈能力”。当战争从“四两拨千斤”升级为算力、人才、产品、生态的全面对耗,DeepSeek那套靠开源、能效与克制变现撑起来的打法,优势正在被稀释。
人、显卡、对手,三股压力汇聚一处,钱自然成了那个绕不开的变量。


普惠
而4月,沉寂一段时间的DeepSeek“回来”了。
V4预览版上线没几天,就把价格降到了行业的生死线:缓存命中场景的输入价被砍掉九成,降到每百万tokens几分钱。据开发者拆解,V4版本单位token的推理算力只有上一代V3.2版本的约四分之一。
这仍是梁文锋的效率逻辑。当部分同行控价保利,把模型当成一门要赚钱的生意时,DeepSeek又一次逆着风向砍了下去。
6月2日,腾讯云宣布,智能体开发平台将对DeepSeek-V4系列模型价格进行下调,最高降幅达97.5%。这是继5月22日DeepSeek官方宣布V4-Pro模型API永久降价、5月27日小米跟进旗下MiMo系列降价最高99%之后,国产AI大模型领域掀起的又一轮“普惠潮”。
与此同时,6月3日晚,豆包发布《关于豆包即将推出专业版的说明》,计划面向专业人群推出付费“专业版”,但强调日常基础功能仍然免费。一边降价普惠,一边分层收费,路线分野更清楚了。
价格之外,DeepSeek这家公司也在变。据行业报道,DeepSeek的员工已经开始走出实验室,向各行各业推销模型,试着把技术变成能收费的产品;计划6月推出的V4.1版本,会给企业用户配更多工具、强化对MCP协议的支持、补上图像与音频的理解能力……
用行业媒体援引知情人士的话说,这轮融资本身,也在推动着DeepSeek加快迭代、“向行业主流看齐”、把营收规划真正落地。
回到V4版本本身。除了又一次把模型拉到“白菜价”之外,梁文锋还专门针对多款主流Agent产品做了适配与调校。按DeepSeek内部的说法,在Agentic Coding的评测里,V4-Pro版本已经做到开源模型中的最好水平。
不过,团队在技术报告里也没有回避差距,直言V4版本的综合能力仍落后于GPT-5.4与Gemini-3.1 Pro,整体进度比最前沿的闭源模型大约慢三到六个月。对标最顶尖的那几个对手,梁文锋要解的其实始终是同一道题:当算力越来越贵,他还能不能靠架构上的极致创新,把成本一次次拉下来。
“不诱于誉,不恐于诽,率道而行,端然正己。”V4版本的发布公告里,梁文锋以这样的一句总结表明初心。
他想做的原本是最好的基础模型和前沿创新,可当巨头掉头反攻,这种“克制”越来越奢侈;而要在引入资本的同时守住路线主导权,他也只能亲自押上200亿元。
据行业报道,在转向公开融资之前,梁文锋曾与某互联网大厂就独家注资数次商谈,但对方“出让20%股份”的条件没有得到他的同意,他最终选择了一轮谁都无法单独主导的多方融资。
分析人士算过一笔账,按一百倍市销率推算,500多亿美元的估值需要大约5亿美元的年收入来托底,而DeepSeek的收入结构相对单一,开源又让大量企业选择自行部署、绕开了付费API。未来一年,最大的问题是它能不能把收入真正放量。
事实上,DeepSeek已经在自建数据中心、招募数据中心工程师,宁德时代入股也是补齐“从模型到能源”的全栈逻辑。
可以预期的是,梁文锋会继续硬啃华为昇腾。V4版本已经在技术报告里给华为昇腾和英伟达各留了一手,他赌的是国产替代终能跑通,哪怕过程坎坷。开源大概率仍会是他的信仰,也是他最深的护城河。
他在《暗涌》专访里说过,要让中国的AI从技术的受益者,变成贡献者。而这一次,他把自己的200亿元也一起押了上去。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。