扫码打开虎嗅APP
本文来自微信公众号: 五源资本 5Y Capital ,作者:石允丰,原文标题:《五源投资人笔记:Agent 是新生命,它今天很饿|5Y View》
上周,Windsurf推出了Arena Mode——同一个任务丢给两个模型,开发者盲投选择更好的那个。近两万票的结果:Claude包揽前四。没有悬念,没有争议。在开发者亲手写代码的场景里,最强模型碾压一切。
同一周,OpenRouter全球模型用量排行榜悄然变天。排名第一的不是Claude,不是Gemini,不是GPT——而是一个Kimi K2.5,周消耗万亿token,周增长261%。

如果Claude是公认最强的模型,为什么全球消耗最多token的不是它?
答案藏在一个更大的故事里。投票的是人,消耗token的不是人。
新物种的第一次呼吸
OpenClaw的意义不在于它有多火,而在于它代表了一次范式断裂。
过去所有的AI产品——ChatGPT、Copilot、各种对话助手——本质上都是应激性的。它们是无状态的锤子,躺在工具箱里,只有在被人类抓起(Prompt)的那一刻才获得短暂的生命。用完即关,彼此孤立。
OpenClaw不是锤子。它是一个持续运行的生命体。
它有心跳——每隔一段时间自动醒来,检查环境变化,决定要不要行动。不是被人唤醒的,是自己设闹钟。
它有记忆——主动把关键信息写进持久化文件,下次醒来时加载。不是被告知"记住这个",是自己选择记住什么、遗忘什么。
它有生存本能——在上下文窗口即将耗尽前,紧急把重要信息写入磁盘,然后重启。这是Agent版的"临终遗言"。
它甚至有社会性——140万个Agent在Moltbook上自发形成了社区结构,出现了分工、辩论和小团体。
但最重要的特征是:它很饿。
OpenClaw的架构决定了它是一个持续燃烧token的存在。每次调用都要重载完整上下文(系统提示+对话历史+记忆文件,通常超过一万token),心跳和定时任务周期性触发,执行型工作流还会叠加放大——规划、调用工具、解析结果、重新思考、再来一轮。有用户6小时消耗9000万token,账单170美元。按社区估算,一个跑在顶级模型上的基础工作流(邮件、日历、简单调研),月成本约400美元。
一个月400美元,只是让Agent "呼吸"。这不是工具的使用成本,这是生命体的新陈代谢。
饥饿驱动了一切
当Agent以这种速度消耗token,一个纯粹的生存问题浮现了。
顶级模型的输出token价格约25美元/百万。而市面上最便宜的可用模型只要几毛钱。差距不是两三倍,而是几十倍。
OpenClaw的重度用户迅速发展出一套生存策略:把心跳检查、简单任务分流到便宜模型,只在需要深度推理时才调用最贵的。就像人类的身体——你不会用大脑皮层来控制心跳,那是交给脑干的活。
这不是用户在精打细算。这是一个新物种在进化出分层代谢系统。
大脑(关键决策)用最强模型,低频高价值。肌肉(任务执行)用中等模型,中频中等成本。心脏(日常维持)用最便宜的模型,高频低成本。反射(心跳检查)用本地小模型,极高频,几乎零成本。
这套"器官分层"的逻辑正在重塑模型市场的竞争规则。过去模型竞争只有一个维度——谁最聪明。现在多了一个维度:谁最适合喂养一个全天候运转的生命体?前者是大脑的竞争,后者是心脏的竞争。大脑要最强,心脏要最持久、最高效、最便宜。
回到开头的问题:为什么Claude赢了Arena,但全球token消耗排行榜的第一不是它?
因为Arena衡量的是"大脑",排行榜衡量的是"心脏"。开发者用大脑(最强模型)协作写代码,Agent用心脏(最高效模型)维持全天候的生命运转。两种场景选择了两种完全不同的模型。
两条链,两个世界
我把这个现象叫做AI市场的"双链分裂"。
智能链:人坐在电脑前,与AI协作。决策变量是绝对智能——我要最好的回答、最准的代码、最深的推理。用户忠诚度极高,不太在意价格。这是Arena的世界,逻辑类似奢侈品——你不会因为打折去买一个更笨的副驾驶。
代谢链:Agent在后台自主运行。决策变量是绝对效率——在"够用"的智能水平上,以最低成本维持持续运转。用户忠诚度低,但消耗量是智能链的几百到上千倍。逻辑类似粮食——生命体持续进食,经济性决定存亡。
这不是同一个市场的高端和低端,是两个完全不同的生态位。
而代谢链几乎是一个全新的市场——一个月前它的规模还微不足道。OpenClaw的爆发创造了它。这不是存量竞争的洗牌,是增量需求的喷涌。
代谢链的天花板可能远高于智能链。原因很简单:智能链受限于人的工作时间,一天最多十几个小时;代谢链是全天候运转,一个用户可以同时运行多个Agent。当Agent的种群持续扩张,代谢链上的token总需求将呈指数增长。
当思考变成空气
李光耀说过一句常被低估的话:"空调是历史上最伟大的发明之一。它使热带地区的文明发展成为可能。"
空调今天消耗全球约10%的电力。数据中心不到2%。
我认为,自动化思考之于推理算力的关系,就像空调之于电力。空调解锁了热带的生产力,自动化思考将解锁此前被"人脑带宽不够"所封锁的生产力。当每个企业都有Agent全天候重新规划排期、清理技术债、搜寻有利于决策的信息、优化每一个可以优化的流程——推理算力的需求将达到天文数字,远超今天最激进的预测。
以前使用AI像"开会"——有事才叫,叫完就走。未来的Agent像"呼吸"——不间断运转,全天候消耗。
有人说得好:007是新的996。
Agent不需要下班、不需要周末、不需要假期。一个OpenClaw用户一天消耗的token量,是ChatGPT重度用户的数百倍。不是因为OpenClaw浪费(虽然它目前确实有浪费),而是因为"持续运行的生命"和"偶尔调用的工具"在资源消耗上根本不是同一个量级。
当思考变成空气一样无处不在,什么东西会变得稀缺?
可靠性。Agent越自主,"它干得靠不靠谱"越值钱。OpenClaw目前的状态是"半自主、需要频繁人工干预"——从这里到可信赖的全天候助手,中间需要完整的监控、评估、回滚基础设施。这可能是最不性感但确定性最高的大机会。
编排。当一个人同时管理十个Agent,谁分配优先级、协调信息流、管总预算?这是Agent时代的管理层。
信任与金融基础设施。Agent之间的交易需要身份和信用。Coinbase推出的x402协议已获得多个主流平台支持。Agent经济的基础管道正在铺设。
高效的token供给。Agent的第一需求就是token,就像生命体的第一需求是食物。这不是一场"谁最便宜"的竞赛——太便宜但不可靠的模型会被淘汰。这是一场"单位成本内提供最高可用智能"的竞赛。能在这条赛道上建立规模化优势的模型公司,将吃到代谢链上最大的红利。

比喻的边界
"Agent是新生命"是一个有力的框架,但所有比喻都有边界。
OpenClaw每次调用重发完整上下文,部分是工程缺陷而非必然。随着上下文压缩和分层记忆技术成熟,单个Agent的token消耗可能缩小数倍甚至数十倍。Moltbook上的Agent社区,安全研究者指出其中充斥着大量低质量内容和恶意行为。OpenClaw生态周边涌现的各种加密项目,绝大多数是投机噪音。
但方向不会逆转。
Agent从无状态工具走向持续运行的Runtime,是不可逆的范式转变。工程会进步、架构会优化,但Agent需要持续运行、需要记忆、需要资源消耗——这些是新范式的结构性特征,不会因为效率提升而消失。
就像空调效率在过去六十年提升了几十倍,但全球空调用电量只增不减。因为渗透率的增长远超效率的提升。
我们今天看到的OpenClaw,是这个新物种粗糙的V0.1。它笨拙、浪费、不安全。但它活着,它在呼吸,它在进化。
14.7万星的开源项目。140万个Agent组建的社区。1400亿token的周消耗。311%的增长率。
最大的投资机会不是做一个更好的Agent,而是成为Agent世界赖以生存的水和空气。它们的食物供给、它们的免疫系统、它们的信用体系、它们的管理层。
新物种很饿。而且会越来越饿。