扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
中美AI竞争已从技术能力转向商业模式分化:OpenAI走高价封闭路线,DeepSeek以近乎免费策略推动AI基础设施化,背后是算力基建、人才争夺与全球市场渗透的深层博弈。 ## 1. 商业模式的分野:从技术竞赛到定价权争夺 - DeepSeek V4以百万上下文免费服务为核心卖点,输入输出价格仅为GPT-5.5的1/150(V4-Flash输入0.2元/百万Token vs GPT-5.5 Pro输入30美元) - OpenAI转向高价精装服务,而DeepSeek试图将AI变成"水电煤"级基础设施,本质是商业路径的彻底分化 ## 2. 算力基建:内蒙古机房背后的重资产转型 - DeepSeek被迫从轻资产算法公司转向自建乌兰察布数据中心,依托华为昇腾生态对抗美国芯片封锁 - 中国特高压电网和绿电优势(乌兰察布电价低50%)成为关键支撑,与硅谷的电力危机形成鲜明对比 ## 3. 人才与资本的赎买战争 - 大厂千万年薪挖角导致DeepSeek核心团队流失(5名核心成员被腾讯/小米/字节挖走) - 3000亿估值融资本质是"用资本反制资本",通过外部注资维持研发阵型,但牺牲了技术理想纯粹性 ## 4. 端侧AI:手机里的游击战突围 - 中国厂商通过模型蒸馏将大模型压缩至1.2-2.5GB塞入手机(如MNN Chat搭载DeepSeek R1) - 边缘计算规避云端算力封锁,形成"集中供暖vs小火炉"的差异化竞争路径 ## 5. 全球南方的数字平权实践 - 中国开源模型支持31种非洲语言(如乌干达Sunflower系统),在OpenRouter平台Token消耗量占比达61% - 低价策略使AI渗透至人均月收入150美元的乌干达等地区,形成"农村包围城市"的市场格局
2026-04-24 19:39

OpenAI向左,DeepSeek向右

本文来自微信公众号:动察Beating,作者:Sleepy.md,题图来自:视觉中国


2026 年 4 月 24 日,DeepSeek V4 预览版正式发布。


这款包含 1.6 万亿参数的 Pro 版本和 2840 亿参数的 Flash 版本的国产大模型,把最核心的卖点砸向了市场,百万上下文,成了所有官方服务的免费标配。


几乎同一时间段,大洋彼岸的 OpenAI 也端出了 GPT-5.5。它的算力更庞大,Agent 功能更丰富,但价格也要贵得多。


“百万上下文”翻译成大白话,意味着 AI 不再是一条只能记住你前几句话的“金鱼”,而是变成了一个能一口气吞下三本《三体》、一秒钟看懂一部两小时电影、还能顺便帮你把错别字挑出来的“超级大脑”。


举个最直接的例子,你可以把公司过去三年的所有合同、邮件、财报,一股脑扔给 V4,让它帮你找出那笔被藏在第 47 页附件里的违约条款。过去,这件事需要一个律师团队;现在,它是免费的。


GPT-5.5 把这种超级大脑明码标价,标准版每百万输入 Token 要 5 美元,输出 30 美元;而面向高阶任务的 GPT-5.5 Pro 版本,更是卖到了每百万输入 30 美元、输出 180 美元的天价。


但根据 DeepSeek 官方定价,V4-Flash 缓存命中的输入每百万 Token 仅 0.2 元人民币,输出 2 元;即便是比肩顶级闭源模型的 V4-Pro,缓存命中输入为 1 元,缓存未命中输入为 12 元,而输出价格仅为 24 元。


大家总以为中美 AI 竞争是模型能力的赛跑,实际上,这早就变成了一场商业模式的分道扬镳


OpenAI 曾经是那个高喊“造福全人类”的屠龙少年,现在却在卖着价格昂贵的精装商品房;而 DeepSeek,正在用近乎免费的算力,把 AI 变成水电煤。


当 OpenAI 变成精明的包工头时,DeepSeek 为什么要不计成本地把顶尖 AI 变成免费的自来水?这场定价权转移的背后,到底隐藏着怎样的暗流?


乌兰察布的冷风


大模型的决胜局,在内蒙古零下 20 度的机房里。


就在 V4 发布前不久,DeepSeek 的招聘需求里多了一个让人意外的岗位:数据中心高级交付经理与高级运维工程师,月薪最高 3 万,14 薪,驻场内蒙古乌兰察布。



这是一家曾经标榜“极简、纯粹、只做算法”的轻资产公司。


过去两年,他们最骄傲的标签就是“四两拨千斤”,用不到 600 万美元的训练成本,打出了让美股 AI 板块暴跌的 DeepSeek-R1。


但 V4 的庞大算力需求,加上美国越来越紧的算力封锁,彻底打碎了这种轻资产的田园诗。


2025 年,美国商务部进一步收紧了对华 AI 芯片的出口管制,英伟达 H100、H800 已经断供,就连降级版的 H20 也被拉进了管控名单。这意味着 DeepSeek 未来的算力扩张,必须全面转向华为昇腾生态。


在 V4 的发布说明中,官方明确表示新模型得到了“华为昇腾加持”,并透露下半年昇腾 950 超节点批量上市后,Pro 的价格还会大幅下调。


这一转向,不是在代码里改几行适配层就能完成的,它需要从零开始,在物理层面建立一套完整的国产算力基础设施。


V4 的万亿参数规模(预训练数据高达 33 万亿 Token),加上百万上下文的庞大计算需求,意味着你需要成千上万张昇腾芯片,需要能容纳这些芯片的机房,需要为这些机房供电的电网,需要在零下 20 度的寒风里维持这些机器不宕机的运维团队。


梁文锋把方法论从比特世界打到了原子世界。


算力,最终都要在钢筋水泥和输电线里落地生根。


一边是穿着格子衫在硅谷敲代码、喝着手冲咖啡的 AI 精英,一边是裹着军大衣去内蒙古草原深处守机房的运维人员。这种差异,构成了今天中国 AI 抵抗算力封锁的底色。


从纯算法公司转型为自建机房的“重资产”玩家,意味着 DeepSeek 告别了“小力出奇迹”的游击战时代,正式穿上了重装步兵的铠甲。


这种转型的代价是巨大的,修机房、买芯片、拉网线,每一项都是无底洞。更重要的是,这种重资产模式意味着运营成本会呈指数级上升,而 DeepSeek 的商业化收入依然极其有限。


这种定价策略,本质上是在用亏损换生态,用免费换基础设施的话语权。


一个曾经拒绝所有巨头、靠量化交易自己掏钱补贴 AI 的硬汉,在这个无底洞面前,还能撑多久?


200 亿美元的妥协


4 月,DeepSeek 传出了启动首次外部融资的消息,目标估值高达 3000 亿人民币(约 440 亿美元),计划增资 500 亿,其中对外募资 300 亿。腾讯与阿里争抢入局的传闻甚嚣尘上。


很多人以为,这是因为建机房太费钱了。但实际上,DeepSeek 融资的核心驱动力,除了买显卡,更是因为“纯粹的技术理想”,在巨头的人才绞肉机面前,不堪一击。


在 V4 研发的关键冲刺期,国内大厂对 DeepSeek 开启了疯狂的定向挖角。从 2025 年下半年至今,DeepSeek 至少 5 名核心研发成员确认离职。第一代模型核心作者王炳宣去了腾讯,V3 核心贡献者罗福莉被雷军千万年薪挖至小米,而 R1 核心作者郭达雅则加盟了字节跳动的 Seed 团队。


这是市场经济最赤裸的运作方式,当你的竞争对手手握无限弹药,而你坚持用自有资金维持运转时,人才市场就是你最脆弱的软肋。


你可以要求天才们为了改变世界的理想降薪加班,但当大厂把一张写着千万现金和期权的支票拍在桌子上,并许诺无限的算力资源时,理想主义的定价权就不在你手里了。


梁文锋的困境,其实是每一个试图在中国做“慢公司”的创业者都会遇到的困境。在一个大厂能用钱把任何人买走的市场里,“不融资、不商业化、只做技术”的路线,是极其奢侈的。它的代价,是你必须接受自己的团队随时可能被对手用钱清场。


这 3000 亿估值的融资,不是梁文锋对资本的妥协,而是他为了保住 V4 研发阵型,向大厂发起的一场赎人战争。他必须坐上资本的牌桌,用同样的真金白银,让留下来的人有足够的理由继续留下来。


腾讯与阿里的可能入局,意味着 DeepSeek 从此不再是那个孤独的、纯粹的技术理想主义者。它变成了一家有外部股东、有商业化压力的公司。这种转变的代价,是梁文锋曾经最引以为傲的那种“不受外部压力干扰的研究自由”,将不可避免地被稀释。


但他没有选择。


当理想主义被迫穿上资本的铠甲,支撑这台庞大机器继续运转、支撑乌兰察布机房日夜轰鸣的底气,究竟来自哪里?


另一种“大力出奇迹”


答案不在算法里,在电网里。


硅谷现在最焦虑的不是芯片不够,而是电不够。马斯克在田纳西州孟菲斯疯狂建设超级数据中心,OpenAI 甚至开始讨论投资核电站,微软宣布重启宾夕法尼亚州的三里岛核电站来为 AI 数据中心供电。算力的尽头是电力,这是一个极其冰冷的物理常识。


在美国,一个大型 AI 数据中心的用电量,相当于一座中等城市的日常用电。而美国的电网,是一张建于 20 世纪 50 年代的老旧网络,扩容缓慢,区域割裂,根本跟不上 AI 时代的算力扩张速度。


而支撑中国 AI 追赶美国的,不仅是那些拿着千万年薪的算法天才,更是那些默默无闻的特高压输电线。


乌兰察布的数据中心之所以能拔地而起,靠的是内蒙古丰富的绿电,以及中国世界第一的电网调度能力。公开数据显示,乌兰察布绿电装机容量达 1940.2 万千瓦,占比约 65.9%,当地低价绿电较东部地区便宜约 50%。再加上年均气温仅 4.3℃,自然冷却期接近 10 个月,能让设备节能 20% 到 30%。


当 DeepSeek V4 运行时,真正为其输血的,是中国庞大且极其廉价的电力基础设施。这是另一种维度的“大力出奇迹”。


这里有一个极其有趣且残酷的历史对照。1986 年,美国用《美日半导体协议》把日本的半导体产业打趴下了,强迫日本开放市场、接受价格管控,日本半导体的全球市场份额从 1986 年的 40% 一路跌到 2011 年的 15%。日本用了三十年都没能缓过来。



今天,美国试图用同样的逻辑锁死中国 AI,封锁芯片、限制算力、切断技术供应链。但中国的反击路径,和日本完全不同。


日本当年的失败,在于它的半导体产业高度依赖美国的技术授权和市场准入,一旦被切断,就失去了独立生存的能力。而中国 AI 的反击,是从最底层的物理基础设施开始重建的,自己造芯片、自己建机房、自己拉电网、自己开源模型。


这是一种极其笨重、极其耗钱、但也极其难以被“绞杀”的路线。当硅谷在云端修建华丽的巴别塔时,中国在泥土里挖战壕。


如果云端的算力拼杀是一场极其惨烈的重资产消耗战,除了去内蒙古修机房、拉电线,我们还有没有逃离云端霸权的另一条路?


逃离云端


当硅谷巨头们把数据中心修得越来越大,甚至像 OpenAI 一样筹划着千亿美元级别的算力集群时,中国的反击线,却悄悄转移到了地下。


对抗美国算力封锁的终极武器,其实不是造出比 H100 更强的芯片,而是把大模型塞进每个人的手机里。


既然我们在云端机房里拼不过重火力,那我们就把战场拉回到 14 亿台智能手机和边缘设备上。这是一种典型的游击战打法,而且是一种极难被封锁的打法,你可以禁止出口高端 GPU,但你没办法没收每个中国人口袋里的手机。


2026 年,伴随着 DeepSeek 引发的算力焦虑,中国手机厂商小米、OPPO、vivo 开始了一场疯狂的“端侧转移”。他们不再满足于仅仅把手机作为一个调用云端 API 的显示器,而是通过极致的模型蒸馏和压缩,把一个缩小版的超级大脑,硬生生塞进了几千块钱的国产手机里。


这种技术路线的核心,是“蒸馏”。简单来说,就是用一个超级大模型(老师)去训练一个小模型(学生),让小模型学会老师的“思维方式”,而不是死记硬背老师的所有“知识”。


经过极致的蒸馏和量化压缩,一个原本需要几百张 GPU 才能跑的大模型,被压缩到只有 1.2GB 到 2.5GB 大小,在一颗手机芯片上就能流畅运行。


像 MNN Chat 这样的移动端 AI 应用,已经能让用户在手机上本地运行 DeepSeek R1 蒸馏模型。这种端侧 AI 的意义在于,你不需要时刻连着 5G 信号,不需要每个月给硅谷巨头交 100 美元的订阅费。大模型就在你的口袋里,断网也能跑,不用给云端算力花一分钱。



既然我修不起集中供暖的超级锅炉房,那我就给每家每户发一个小火炉。


当然,端侧 AI 并不完美。受限于手机芯片的算力和内存,端侧模型的能力上限远不如云端的超大模型。它能帮你写一封邮件、翻译一段文字、总结一篇文章,但如果你想让它帮你推导一个复杂的数学定理,或者分析一份几百页的法律合同,它还是会力不从心。


但这已经足够了。因为对于绝大多数普通人来说,他们需要的 AI,从来就不是那个能推导数学定理的超级大脑,而是一个能帮他们处理日常琐事的“贴身助理”。


当大模型变得极其廉价,甚至可以装进口袋里时,它将如何改变那些被硅谷遗忘的角落?


全球南方的数字平权


如果你坐在曼哈顿全景玻璃办公室里,你大概率会觉得,GPT-5.5 涨价到 100 美元是值得的,因为它能帮你在一秒钟内写完一份完美的并购财报。


但如果你站在东非乌干达的一片玉米田里,面对着因为气候异常而枯黄的庄稼,100 美元的订阅费没人能交得起,因为乌干达的人均月收入不到 150 美元。


硅谷的巨头们在讨论如何用 AI 统治世界,而乌干达的农民和东南亚的穷学生,却因为 DeepSeek 的开源,第一次走进了数字时代。


GPT-5.5 服务于付得起钱的人,并且它的语料库几乎全是英语。如果你用斯瓦希里语或者爪哇语去问它一个问题,它不仅回答得磕磕巴巴,而且消耗的 Token 是英语的几倍。硅谷巨头因为“商业回报率低”,主动放弃了这些边缘市场。


而中国的开源模型,成了全球南方的数字基础设施。


在乌干达,当地的非政府组织 Sunbird AI,用基于中国开源模型 Qwen 微调出的 Sunflower 系统,把能支持的本地语言从 6 种一举扩展到了 31 种。这个系统现在被部署在乌干达政府的农业推广系统里,用斯瓦希里语给农民发送种植建议。


在马来西亚,科技公司用开源底座微调出了符合伊斯兰教法的 AI 模型,不仅支持马来语和印尼语,还确保输出内容符合穆斯林市场的宗教与文化标准。从印尼的数字身份系统到肯尼亚的斯瓦希里语医疗问答,中国技术正在渗透进这些国家的社会底层架构。


全球最大 AI 模型 API 聚合平台 OpenRouter 在 2026 年初发布的数据显示,中国 AI 模型在该平台的 Token 消耗量首次超过美国竞争对手。在某一统计周内,全球前 10 大热门模型共消耗 8.7 万亿 Token,其中中国模型占比达到约 61%。



开源打破了美国对 AI 话语权的垄断,让资源匮乏的发展中国家跨越了数字鸿沟。这不是什么中美争霸的宏大叙事,这是 AI 时代真正的“农村包围城市”。


中国的 AI 开源战略,客观上正在成为一种极其有效的“软实力”输出。当硅谷的巨头们在云端筑起高墙,试图成为新时代的数字地主时,那些付不起租金的“技术难民”,终于在开源和端侧的泥土里,找到了属于自己的火种。


自来水


技术从来就不应该是高高在上的奢侈品。


硅谷造出了极其精美的商品房,门禁森严,只对 VIP 开放。但我们修了一条通向千家万户的自来水管。


这条水管的起点,在内蒙古零下 20 度的机房里,在特高压输电线的轰鸣中,在 3000 亿估值的战争里。它的每一段都沉重、都昂贵、都充满了被迫与妥协。梁文锋曾经想做一家纯粹的技术公司,但现实逼着他去建机房、去融资、去和大厂抢人。他没有选择,因为他选择了一条更难的路,不把 AI 做成奢侈品,而要把它做成自来水。


而这条水管的终点,在一台几千块钱的国产手机上,在乌干达农民粗糙的手指间,在每一个渴望跨越数字鸿沟的普通人生活里。


算力的围墙建得再高,也挡不住流向低处的自来水。


本文来自微信公众号:动察Beating,作者:Sleepy.md

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

大 家 都 在 搜