扫码打开虎嗅APP
本文来自微信公众号: 未尽研究 ,作者:未尽研究
年初,中国爆发过一阵“token出海”的叙事,它本质上是对“算电协同”的一种想象。市场敏锐地捕捉到了中国独有的双重优势:既有开源模型性价比带来的技术普惠,又有丰沛且廉价的电力资源作为能源底座。通过将海外推理请求,调度至国内数据中心,能够以更低成本完成AI任务。
从更底层的成本结构看,运输能源的成本,高于输送电力,更高于算力的直接调度,这也使得算力在理论上成为最具跨区域流动性的生产要素。而token,则是在这一过程中,将能源、算力与模型能力,统一为可计量、可定价的单位,从而具备被交易与流通的基础。
这种模式不再以模型、算力设备或电力资源的形式跨境流动,而是以内嵌于服务的形式,通过接口被远程调用与消费。
但是,对于“token出海”而言,更关键的不仅在于请求是否跨境调用,而更在于生产与价值的归属:即用于生成token的算力与能源成本,是否由位于中国的实体承担,并获得来自海外市场的收入。
在这个意义上,年初的“token出海”热潮,其实算不上真正意义上的“token出海”。它存在,但并非主流。事实上,直到今日,它更多地仍然以“模型出海”或“算力出海”的形式展现出来。当然,这仍然很好;但它脱离了“算电协同”的叙事框架。
最近一个月,在全球最大的API聚合平台OpenRouter上,中国模型提供了接近60%的token。它们来自小米、阿里巴巴、DeepSeek、阶跃星辰、MiniMax、智谱与Kimi。乍看之下,这似乎印证了“token出海”的说法,但事实并非如此。

对于那些表现突出的开源模型,全球云厂商往往采取“拿来主义”,第一时间将其部署到自身的云基础设施上。这意味着,token的生产成本与服务收入,未必与模型的原始开发者直接相关,而更多取决于模型的开源协议与部署方的商业化能力。
以DeepSeek V-3.2为例,在OpenRouter接入的服务提供商中,除了DeepSeek自身的API,还包括如DeepInfra在内的一系列美国新兴AI云厂商。这些厂商的算力资源主要位于美国,本地服务美国企业与开发者。因此,对应的大量token消耗,也是在美国完成生产与消费。

在年初“token出海”叙事最为热闹的阶段,现实情况更接近于这一模式。所谓“token出海”,在很大程度上只是开源模型驱动的“模型出海”,而token的生产与价值捕获,仍然在美国市场内部形成了闭环。
不过,情况正在发生变化。近期,OpenRouter上排名前二的模型,来自小米的MiMo-V2-Pro,与阿里巴巴的Qwen3.6 Plus(free),均未开源。以前者为例,其唯一的服务提供方即为小米本身,应该算“token出海”。
但问题仍然存在。以小米为例,其算力不仅部署在中国大陆(CN),也“出海”分布于新加坡(SG)与荷兰(NL)。因此,即便token由该公司提供,也难以简单判定,token的生产就一定发生在中国本土,充分利用了中国的电力优势。对于像阿里巴巴这样的全球云厂商而言,情况则更为复杂。

从这个角度看,“token出海”的边界开始变得模糊。仅凭OpenRouter的公开数据,已难以精确衡量其中真正属于“出海”的相对规模。而且,作为一个API聚合平台,它还无法覆盖海外企业直接调用中国厂商官方接口的情况,因此在一定程度上也可能低估“token出海”的绝对规模。
当然,我们不妨期待,随着token经济逐渐成为企业运营与宏观分析的重要指标,其跨区域分布与收入归属,或将像财报中的地域收入一样,被更细致地披露与统计。
截至目前,token的全球贸易仍然是相对自由的。MiniMax海外收入占比已超过70%,服务覆盖100多个国家和地区的21.4万家企业与开发者,说明token及其所承载的AI服务,已经可以在全球范围内流动与变现。当然,也有杂音,Anthropic就开始要求部分用户通过护照等方式进行身份验证。
从token经济的需求侧看,欧美市场仍然是中国“token出海”的主要目的地。其拥有全球最大的企业软件市场,同时白领劳动力成本长期高企,使得以AI替代人力的需求尤为强烈。
这一点也体现在OpenRouter的支出分布中:美国市场约占近50%,欧洲约占20%,构成了token消费的核心区域。在此背景下,海外开发者开始“熬夜抢购”智谱Coding Plan,也成为需求快速释放的一个缩影。
而从token经济的供给侧看,“一带一路”及中国周边地区,可能成为“token出海”的潜在承接区域。早在2024年,未尽研究在《AI改变能源:智算如何引领新型电力系统》中就提出,一些具备能源优势的地区,如新疆与云南,不仅可以向东部输送绿电,或在本地布局算力基础设施,还可以分别面向中亚、东南亚等地,建设智能碳的“一带一路”。
在这一框架下,电力、算力与AI服务,逐渐形成一体化结构。低碳、低成本的绿色能源,转化为算力,再进一步转化为可被调用与计量的token。这构成了一种潜在的区域性算力与AI服务输出模式。
但是,“token出海”更像是一种面向未来的长期布局,而非已经成型的规模化服务贸易模式。短期内,它确实可以在部分时延要求不高的小规模推理任务、开发者试用等场景中成立,但尚未形成稳定的跨境交易与收入结构。
一方面,尽管中国电力资源在存量与增量上都远超美国,但中国在算力硬件的供给上仍然逊于美国。按照EpochAI最新统计,如果按H100当量计算,中国的算力规模仅相当于甲骨文一家公司的水平,远不及谷歌、微软、亚马逊与Meta。

中国的AI应用正在蓬勃发展,AI智能体与视频生成激战正酣,科技巨头自己都不够用。字节跳动的视频生成,用户排队领号的时间越来越长;腾讯的策略则是“减少了对外出售,以保证自用算力充足”。
在这一背景下,部分中国模型在OpenRouter上的token调用量阶段性冲高,更接近于一种以价格补贴驱动的市场拓展行为。无论是年初的MiniMax,还是近期的阿里巴巴Qwen,其“优惠”甚至“免费”的API策略,本质上更类似于营销获客与生态培育成本,而非可持续的运营成本。在一定程度上,这类投入放大了市场关注与估值预期,成为“token出海”叙事的重要杠杆,但尚不足以代表真实的供给能力。
另一方面,AI产业链的最优配置,或许应当沿着成本最低的路径集中:能源、算力与模型能力,在不同环节实现跨国最优组合。
但现实并非如此。美国持续限制高端算力芯片与模型的出口,欧洲强化数据保护与本地存储要求,就连东南亚与中东等新兴市场,也开始强调“主权AI”。
在这一背景下,对中国而言,更可行的路径并非“token出海”,而是“算力出海”与“模型出海”:在海外建设数据中心,实现本地存储与本地推理。同时,“算电协同”也意味着新能源与储能体系的同步出海,本质上仍是一种围绕算力的本地化扩展。
在更极端的情境下,中国“token出海”甚至可能对全球服务外包格局产生冲击。过去由印度等国家承接的客服与内容服务,建立在低成本且具备语言与专业能力的人力之上;而在AI时代,这类服务正被快速抽象为按token计价的推理能力。
在这一意义上,这种转变对传统服务外包体系的冲击,或许不亚于制造业自动化对低端制造业的替代,甚至可能在未来引发围绕“token出海”的贸易摩擦与监管壁垒。