扫码打开虎嗅APP
本文来自微信公众号: 深潮 TechFlow ,作者:值得关注的
1858年的夏天,一根铜芯电缆横穿大西洋海底,把伦敦和纽约连在了一起。
这件事的意义从来不在于传输速度,而在于权力结构,谁铺设了海底电缆,谁就能在信息流动中抽水。大英帝国靠着这张全球电报网,把殖民地的情报、棉花的价格、战争的消息都攥在手里。
帝国的强大不仅是有舰队,还有那根电缆。
一百六十多年后,这个逻辑正在以一种意想不到的方式重演。
2026年,中国大模型正在悄悄吃掉全球开发者市场。OpenRouter最新数据显示,平台前十模型的Token消耗中,中国模型独占61%,前三名清一色来自中国。旧金山、柏林、新加坡的开发者每天发出的API请求,正穿越太平洋海底光缆抵达中国数据中心,算力在那里消耗,电力在那里流动,结果传回来。
电力从未离开中国电网,但它的价值通过Token完成了跨境交付。
AI模型大迁徙
2026年2月24日,OpenRouter发布了一份周度数据:平台前十模型的总Token消耗约8.7万亿,中国模型独占5.3万亿,占比61%。MiniMax M2.5以2.45万亿Token空降榜首,Kimi K2.5、智谱GLM-5紧随其后,前三名清一色来自中国。

2月26日最新数据
这不是偶然,一根导火索点燃了一切。
今年初,OpenClaw横空出世,一个让AI真正开始"干活"的开源工具,可以直接控制电脑、执行命令、并行完成复杂工作流,GitHub星标数周内突破21万。
金融从业者John第一时间安装OpenClaw,并接入了Anthropic API,开始自动监控股市信息,并及时汇报给出交易信号,几个小时后,他盯着账户余额愣了几秒:几十美元,没了。
这就是OpenClaw带来的新现实。过去跟AI聊天,一次对话几千个Token,费用忽略不计。OpenClaw接入之后,AI在后台同时跑十几个子任务,反复调用上下文、循环迭代,Token消耗不是线性的,是指数级的。账单像开着引擎盖的车在加速,油表往下掉,停不下来。
开发者社群里随即流传出一个“妙招”:用OAuth令牌把Anthropic或Google的订阅账户直接接进OpenClaw,把月费制的“无限”额度变成AI Agent的免费燃料,这也是很多开发者采取的方法。
官方的反制随即到来。
Anthropic在2月19日更新协议,明确禁止将Claude订阅凭证用于OpenClaw等第三方工具,要接入Claude功能,必须走API计费通道。Google更是大面积封禁了通过OpenClaw接入Antigravity和Gemini AI Ultra的订阅账号。
“天下苦秦久矣”,Jhon随即投入了国产大模型的怀抱。
在OpenRouter上,国产大模型MiniMax M2.5在软件工程任务上的得分是80.2%,Claude Opus 4.6是80.8%,差距几乎可以忽略。但价格天差地别,前者输入端每百万Token 0.3美元,后者5美元,差了约17倍。
John切了过去,工作流依然运转,账单缩水了一个数量级,这种迁徙正在全球范围内同步发生。
OpenRouter的COO Chris Clark说得很直接,中国开源模型之所以能拿下大量市场份额,是因为它们在美国开发者运行的代理工作流中占比异常之高。
电力出海
要理解Token出海的本质,必须先搞清楚一个Token的成本结构。
它看起来很轻,一个Token大约等于0.75个英文单词,你跟AI的一次普通对话,消耗的也不过几千个Token。但当这些Token以万亿为单位堆叠,背后的物理现实就变得沉甸甸。
拆开Token的成本,核心只有两项:算力和电力。
算力是GPU的折旧摊销,你买下一块英伟达H100,花大约三万美元,它的寿命换算到每一次推理,就是折旧成本。电力是数据中心持续运转的燃料,GPU满载时每块耗电约700瓦,加上冷却系统的开销,一个大型AI数据中心的电力账单可以轻松超过年均数亿美元。
现在,把这个物理过程在地图上画出来。
一个美国开发者在旧金山发出一条API请求。数据从加利福尼亚出发,经由太平洋海底光缆抵达中国某地的数据中心,GPU集群开始工作,电从中国的电网流向那些芯片,推理完成,结果回传。整个过程,也许只用了一两秒。
电力,从未离开中国的电网,但电力的价值,通过Token,完成了跨境交付。
这里有一个普通贸易无法企及的神奇之处:Token没有形体,不需要经过海关,不会被关税打到,甚至不在任何现行的贸易统计口径里。中国出口了大量算力与电力服务,但在官方的商品贸易数据上,它几乎是隐形的。
Token成为了电力的衍生品,Token出海本质是电力出海。
这也得益于中国地相对低廉的电价,综合电价比美国低约40%,这是物理层面的成本差,竞争对手能轻易复制的。
此外,中国AI大模型也有算法和“内卷”优势。
DeepSeek V3的MoE架构让推理时只激活部分参数,独立测试显示其推理成本比GPT-4o低约36倍,MiniMax M2.5同样是229B总参数只激活10B。
最上一层是内卷,阿里、字节、百度、腾讯、月之暗面、智谱、MiniMax……十几家公司在同一条赛道上互相踩踏,价格早就跌破了合理利润区间,赔本赚吆喝已经是行业常态。
细看一下,这和中国制造出海一样,利用供应链优势和行业内卷,将Token价格狠狠打下去。
从比特币到Token
在Token之前,还有一次电力出海。
大约在2015年前后,四川、云南和新疆的电站管理者,开始迎来一批奇怪的客人。
这些人租下废弃的厂房,装进密密麻麻的机器,24小时通电运转。机器什么都不生产,只是不停地做一道数学题,偶尔,会从这道无穷无尽的数学题里,算出一枚比特币。
这是电力出海的第一代形态:把廉价水电和风电,经由矿机的哈希运算,兑换成全球流通的数字资产,再在交易所上变现为美元。
电力没有穿越任何边境,但电力的价值,以比特币为载体,流向了全球市场。
那几年,中国算力一度占到全球比特币挖矿算力的70%以上。中国的水电和煤电,以这种迂回的方式,参与了一场全球资本的重新分配。
2021年,这一切戛然而止。监管重锤落下,矿工四散,算力迁徙到了哈萨克斯坦、美国德克萨斯和加拿大。
但这个逻辑本身从未消失,只是在等待一个新的外壳,直到ChatGPT横空出世,大模型群雄逐鹿,曾经的比特币矿场摇身一变成为了AI数据中心,矿机变成了算力GPU,曾经生产的比特币变成了Token,不变的只有电力。
比特币出海和Token出海,在底层逻辑上是同构的,但Token在当下更有商业价值。
矿机挖矿是一个纯粹的数学计算,产出的比特币是一种金融资产,它的价值来自于稀缺性和市场共识,与“算了什么”毫无关系。算力本身没有生产性,更像是一个信任机制的副产品。
大模型推理不一样。GPU消耗电力,产出的是真实的认知服务,代码、分析、翻译、创意。Token的价值直接来自于它对使用者的效用。这是一种更深层的嵌入,一旦开发者的工作流依赖了某个模型,切换的成本会随时间积累而变高。
当然,还有一个关键差异:比特币挖矿是被中国驱逐出去的,而Token出海,是被全球开发者主动选择的。
Token战争
1858年铺设的那根海底电缆,代表的是大英帝国对信息高速公路的主权,谁拥有基础设施,谁就能定义游戏规则。
Token出海,同样是一场没有宣战的战争,阻力重重。
数据主权是第一道墙,一个美国开发者的API请求经由中国数据中心处理,数据物理上流经了中国。对个人开发者和小型应用来说,这不是问题,但涉及企业敏感数据、金融信息、政府合规的场景,这是一道硬伤。这也是为什么中国模型的渗透率在开发工具和个人应用领域最高,在企业核心系统里几乎没有存在感。
芯片禁令是第二道墙,中国AI发展面临英伟达高端GPU的出口管制,MoE架构和算法优化只能部分抵消这一劣势,天花板依然存在。
但眼前的阻力,只是序章,更大的战场正在成形。
Token和AI模型,已经成为中美之间新的战略博弈维度,不亚于20世纪的半导体、互联网,甚至更接近一个更古老的比喻:太空争霸。
1957年,苏联发射斯普特尼克一号,美国举国震惊,随即启动阿波罗计划,砸下相当于今天数千亿美元的资源,要在太空竞赛中绝不落败。
AI争霸的逻辑与此惊人地相似,但激烈程度将远超太空竞赛。太空毕竟是物理空间,普通人感受不到,AI渗透的是经济的毛细血管,每一行代码、每一份合同、每一个政府决策系统背后,都可能跑着某个国家的大模型。谁的模型成为全球开发者的基础设施默认选项,谁就在无形中获得了对全球数字经济的结构性影响力。
这正是中国Token出海让华盛顿真正感到不安的地方。
当一个开发者的代码库、Agent工作流、产品逻辑都围绕某个中国模型的API构建起来,迁移成本会随时间指数级上升。届时,即便美国立法限制,开发者也会用脚抵制,就像今天没程序员无法抛弃GitHub一样。
今天的Token出海,也许只是这场漫长博弈的开篇。中国大模型没有宣称要颠覆什么,它们只是以更低的价格,把服务送到了全球每一个有API Key的开发者手里。
这一次,铺设电缆的,是那些在杭州、北京、上海写代码的工程师团队,和在南方某个省份昼夜运转着的GPU集群。
这场争霸没有倒计时,它每天24小时都在进行,单位是Token,战场是每一个开发者的终端。