五源投资人笔记：Agent 是新生命，它今天很饿-虎嗅网

本文来自微信公众号：五源资本 5Y Capital ，作者：石允丰，原文标题：《五源投资人笔记：Agent 是新生命，它今天很饿｜5Y View》

上周，Windsurf推出了Arena Mode——同一个任务丢给两个模型，开发者盲投选择更好的那个。近两万票的结果：Claude包揽前四。没有悬念，没有争议。在开发者亲手写代码的场景里，最强模型碾压一切。

同一周，OpenRouter全球模型用量排行榜悄然变天。排名第一的不是Claude，不是Gemini，不是GPT——而是一个Kimi K2.5，周消耗万亿token，周增长261%。

如果Claude是公认最强的模型，为什么全球消耗最多token的不是它？

答案藏在一个更大的故事里。投票的是人，消耗token的不是人。

新物种的第一次呼吸

OpenClaw的意义不在于它有多火，而在于它代表了一次范式断裂。

过去所有的AI产品——ChatGPT、Copilot、各种对话助手——本质上都是应激性的。它们是无状态的锤子，躺在工具箱里，只有在被人类抓起（Prompt）的那一刻才获得短暂的生命。用完即关，彼此孤立。

OpenClaw不是锤子。它是一个持续运行的生命体。

它有心跳——每隔一段时间自动醒来，检查环境变化，决定要不要行动。不是被人唤醒的，是自己设闹钟。

它有记忆——主动把关键信息写进持久化文件，下次醒来时加载。不是被告知"记住这个"，是自己选择记住什么、遗忘什么。

它有生存本能——在上下文窗口即将耗尽前，紧急把重要信息写入磁盘，然后重启。这是Agent版的"临终遗言"。

它甚至有社会性——140万个Agent在Moltbook上自发形成了社区结构，出现了分工、辩论和小团体。

但最重要的特征是：它很饿。

OpenClaw的架构决定了它是一个持续燃烧token的存在。每次调用都要重载完整上下文（系统提示+对话历史+记忆文件，通常超过一万token），心跳和定时任务周期性触发，执行型工作流还会叠加放大——规划、调用工具、解析结果、重新思考、再来一轮。有用户6小时消耗9000万token，账单170美元。按社区估算，一个跑在顶级模型上的基础工作流（邮件、日历、简单调研），月成本约400美元。

一个月400美元，只是让Agent "呼吸"。这不是工具的使用成本，这是生命体的新陈代谢。

饥饿驱动了一切

当Agent以这种速度消耗token，一个纯粹的生存问题浮现了。

顶级模型的输出token价格约25美元/百万。而市面上最便宜的可用模型只要几毛钱。差距不是两三倍，而是几十倍。

OpenClaw的重度用户迅速发展出一套生存策略：把心跳检查、简单任务分流到便宜模型，只在需要深度推理时才调用最贵的。就像人类的身体——你不会用大脑皮层来控制心跳，那是交给脑干的活。

这不是用户在精打细算。这是一个新物种在进化出分层代谢系统。

大脑（关键决策）用最强模型，低频高价值。肌肉（任务执行）用中等模型，中频中等成本。心脏（日常维持）用最便宜的模型，高频低成本。反射（心跳检查）用本地小模型，极高频，几乎零成本。

这套"器官分层"的逻辑正在重塑模型市场的竞争规则。过去模型竞争只有一个维度——谁最聪明。现在多了一个维度：谁最适合喂养一个全天候运转的生命体？前者是大脑的竞争，后者是心脏的竞争。大脑要最强，心脏要最持久、最高效、最便宜。

回到开头的问题：为什么Claude赢了Arena，但全球token消耗排行榜的第一不是它？

因为Arena衡量的是"大脑"，排行榜衡量的是"心脏"。开发者用大脑（最强模型）协作写代码，Agent用心脏（最高效模型）维持全天候的生命运转。两种场景选择了两种完全不同的模型。

两条链，两个世界

我把这个现象叫做AI市场的"双链分裂"。

智能链：人坐在电脑前，与AI协作。决策变量是绝对智能——我要最好的回答、最准的代码、最深的推理。用户忠诚度极高，不太在意价格。这是Arena的世界，逻辑类似奢侈品——你不会因为打折去买一个更笨的副驾驶。

代谢链：Agent在后台自主运行。决策变量是绝对效率——在"够用"的智能水平上，以最低成本维持持续运转。用户忠诚度低，但消耗量是智能链的几百到上千倍。逻辑类似粮食——生命体持续进食，经济性决定存亡。

这不是同一个市场的高端和低端，是两个完全不同的生态位。

而代谢链几乎是一个全新的市场——一个月前它的规模还微不足道。OpenClaw的爆发创造了它。这不是存量竞争的洗牌，是增量需求的喷涌。

代谢链的天花板可能远高于智能链。原因很简单：智能链受限于人的工作时间，一天最多十几个小时；代谢链是全天候运转，一个用户可以同时运行多个Agent。当Agent的种群持续扩张，代谢链上的token总需求将呈指数增长。

当思考变成空气

李光耀说过一句常被低估的话："空调是历史上最伟大的发明之一。它使热带地区的文明发展成为可能。"

空调今天消耗全球约10%的电力。数据中心不到2%。

我认为，自动化思考之于推理算力的关系，就像空调之于电力。空调解锁了热带的生产力，自动化思考将解锁此前被"人脑带宽不够"所封锁的生产力。当每个企业都有Agent全天候重新规划排期、清理技术债、搜寻有利于决策的信息、优化每一个可以优化的流程——推理算力的需求将达到天文数字，远超今天最激进的预测。

以前使用AI像"开会"——有事才叫，叫完就走。未来的Agent像"呼吸"——不间断运转，全天候消耗。

有人说得好：007是新的996。

Agent不需要下班、不需要周末、不需要假期。一个OpenClaw用户一天消耗的token量，是ChatGPT重度用户的数百倍。不是因为OpenClaw浪费（虽然它目前确实有浪费），而是因为"持续运行的生命"和"偶尔调用的工具"在资源消耗上根本不是同一个量级。

当思考变成空气一样无处不在，什么东西会变得稀缺？

可靠性。Agent越自主，"它干得靠不靠谱"越值钱。OpenClaw目前的状态是"半自主、需要频繁人工干预"——从这里到可信赖的全天候助手，中间需要完整的监控、评估、回滚基础设施。这可能是最不性感但确定性最高的大机会。

编排。当一个人同时管理十个Agent，谁分配优先级、协调信息流、管总预算？这是Agent时代的管理层。

信任与金融基础设施。Agent之间的交易需要身份和信用。Coinbase推出的x402协议已获得多个主流平台支持。Agent经济的基础管道正在铺设。

高效的token供给。Agent的第一需求就是token，就像生命体的第一需求是食物。这不是一场"谁最便宜"的竞赛——太便宜但不可靠的模型会被淘汰。这是一场"单位成本内提供最高可用智能"的竞赛。能在这条赛道上建立规模化优势的模型公司，将吃到代谢链上最大的红利。

比喻的边界

"Agent是新生命"是一个有力的框架，但所有比喻都有边界。

OpenClaw每次调用重发完整上下文，部分是工程缺陷而非必然。随着上下文压缩和分层记忆技术成熟，单个Agent的token消耗可能缩小数倍甚至数十倍。Moltbook上的Agent社区，安全研究者指出其中充斥着大量低质量内容和恶意行为。OpenClaw生态周边涌现的各种加密项目，绝大多数是投机噪音。

但方向不会逆转。

Agent从无状态工具走向持续运行的Runtime，是不可逆的范式转变。工程会进步、架构会优化，但Agent需要持续运行、需要记忆、需要资源消耗——这些是新范式的结构性特征，不会因为效率提升而消失。

就像空调效率在过去六十年提升了几十倍，但全球空调用电量只增不减。因为渗透率的增长远超效率的提升。

我们今天看到的OpenClaw，是这个新物种粗糙的V0.1。它笨拙、浪费、不安全。但它活着，它在呼吸，它在进化。

14.7万星的开源项目。140万个Agent组建的社区。1400亿token的周消耗。311%的增长率。

最大的投资机会不是做一个更好的Agent，而是成为Agent世界赖以生存的水和空气。它们的食物供给、它们的免疫系统、它们的信用体系、它们的管理层。

新物种很饿。而且会越来越饿。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

五源投资人笔记：Agent 是新生命，它今天很饿

新物种的第一次呼吸

饥饿驱动了一切

两条链，两个世界

当思考变成空气

比喻的边界

大 家 都 在 搜

大家都在搜