扫码打开虎嗅APP
本文来自微信公众号: 硅星人Pro ,作者:董道力
Agent这个词,AI行业喊了至少两年。2024年起,每一场发布会都在谈Agent,投资机构管它叫下一个万亿市场,创业公司一夜之间改了slogan。但打开产品一看,还是一个对话框等你打字:你给指令,它给回答;你不提问,它就停在那儿。
概念跑得很快,产品形态没跟上。直到OpenClaw出来,这种错位才突然变得可见——不是因为它发明了什么新技术,而是它把那层一直缺失的交互前端拼对了。
OpenClaw这个小龙虾的火热最终没有昙花一现,从一个周末项目起步,短时间冲到十万级GitHub stars,单周两百万访问。但更能说明问题的是它迅速从极客玩具升级为Agent雏形:用户群从开发者扩散到各行各业,运营、创业者、普通人,讨论焦点也从技术实现转向日常使用。2月15日,Sam Altman宣布OpenClaw创始人Peter Steinberger加入OpenAI,也给这轮“个人Agent形态”做了背书。而在各个技术社区、社交媒体、各个线下聚会上,人们还在蜂拥而至给自己部署着各种“龙虾”。
这股龙虾热逐渐演变出了一种行业共识:如果把AI这事拉长来看,当作一整个独立的“产品”,那么ChatGPT们此前其实只是在构建“后端”,这一次它才真正有了“前端”。
1
对话框其实困住了所有人
ChatGPT问世三年多,定义了一个近乎统一的交互范式:一个输入框,你打字,它回复。三年里,绝大多数AI产品都在复制这个模式。豆包、Kimi、Perplexity、Claude,换名字换皮肤换模型,底下还是同一套回合制界面。
对话框看起来很自然,但它把AI锁在了被动位置:你不打开它,它就不存在;你不提问,它就不行动。AI的全部价值,依赖用户主动发起、主动拆解、主动盯过程、主动验收。对重度用户来说这只是习惯,但对多数普通人而言,“想到要用AI”本身就是门槛。
还有一层更隐蔽的问题:对话框把能力限制在了“回答”里。你问一个问题,它给一段文字;你让它写代码,它给一段代码。交互结束,系统即停。它没法替你跑一个持续性任务,没法在你不在的时候盯住什么,没法在发现异常后主动来找你。
对话框是回合制游戏,但真正的助手应该是实时在线的。
Peter Steinberger在Lex Fridman的访谈里把这个点说得更狠:我们现在给Agent的界面,本质上是在“复制Google”——一个prompt、一个聊天框,就像电视刚出现时人们把广播节目原封不动搬到屏幕上播。
换句话说,GenAI的后端能力已经到了2026年的水平,前端界面还停在2010年。Agent的推理与规划能力在变强,UI层基本没变,反而拖住了体验。很多任务明明需要表单、预览、控制、分步反馈,产品却仍在用“聊天”硬扛。
当界面没进化,模型再强,用户体感也只是“聪明了一点”。这也是为什么行业会同时出现两种情绪:一边是能力暴涨,一边是“怎么还是用不起来”。
1
OpenClaw做对了什么
OpenClaw接入了聊天软件,就这么简单。
它跑在飞书、iMessage、Telegram里,能在本地运行、替用户执行动作。消息会弹出来找你,不用切换上下文。对话框是你得专门去打开的东西,聊天软件是你已经待着的地方。跟AI说句话,跟回复一条微信一样随意。
分发上的差距更大。ChatGPT要注册、打开;飞书和Telegram早就装在手机上了。OpenClaw接入这些平台,用户获取AI的门槛降到接近零。用户只有一直在用,才会真正体会到价值。
但入口只是一半。OpenClaw真正的突破是主动性。
Peter在访谈里提到,他给Agent加了定期触发机制,最初的提示词很粗暴:每隔一段时间surprise me。你睡觉它在跑,开会它也在跑。一个等你来用,一个替你去做。喊了两年Agent,直到OpenClaw,大多数人才第一次摸到Agent该有的手感。
Claude Code再强,用户心智被“编程工具”锁死了:打开终端、输入命令、盯输出。OpenClaw更像一个长期在线的代理人,存在方式本身就不一样。
而Agent产品面向用户可能本就该是黑盒。你说“帮我盯着这几个账号”,它去盯着,中间用了什么模型、烧了多少token,不关用户的事。OpenClaw的token消耗比传统对话式AI高一个数量级,但用户不在意——他们看不到过程,只看到结果。
Cowork本来最有机会站在OpenClaw今天的位置,发布时甚至引发了一波软件股恐慌。但它差了两步:没进聊天软件,界面上暴露了太多配置项。Cowork打开是文件夹选择、权限设置、任务进度面板;OpenClaw打开是一个聊天窗口。一个像在操作软件,一个像在跟人说话。
很有代表的点是,很多人用OpenClaw用到现在,就没拿它像AI IDE那样编过程。这个本来跑在终端里的技术产品,用户拿它管邮件、盯热点、整理信息、安排日程、一句话开发。技术栈是程序员的,使用场景完全不是。
1
ChatGPT们只是后端,OpenClaw们定义了前端
过去几年,从GPT-3到GPT-5,从Claude到Gemini,整个行业做的事情其实都是同一件:堆后端。更大的模型、更长的上下文、更好的推理——这些都是基础设施,是水电煤。
ChatGPT们这些GenAI产品和模型,就是后端,负责生成文本、生成代码、调用工具、理解意图。
但后端再强,没有前端也触达不了普通人。互联网的后端是TCP/IP,真正改变世界的是浏览器;移动互联网的后端是3G/4G,真正改变世界的是App Store。后端决定能力上限,前端决定谁能用到这些能力。
OpenClaw所呈现出来的agent就是这一轮AI的前端。它接收意图,在真实环境里做决策、调工具,把结果交付给你。GenAI的能力,不管是生成代码还是逻辑推理,都在后面撑着这个代理。
这也就是为什么GPT-5们发布时行业反应相对平淡:模型确实更强了,但体验在对话框里没有质的变化,用户觉得“好像聪明了一点”,然后继续用原来的方式。后端在进步,前端没变,用户感受到的提升就很有限。
反过来,OpenClaw用的模型并不比别人强——它接的是Claude、GPT、DeepSeek,跟所有人调用的API一样。但它换了前端,体验上像是跳了一代。

Peter在Lex的访谈里用一句话把这个未来推到了极端:every app is just a very slow API now。Twitter/X对访问设限,并没有真正让Agent“不可能”读取内容——Agent只需要打开浏览器去读,只是成本更高、速度更慢。
也就意味着,当Agent能替你跨越一堆界面完成工作,App这层“为人类设计的UI”就会逐渐退化为“为Agent提供的数据与动作接口”。用户不再“使用”你的产品,用户的Agent替他们“调用”你的产品。
越标准化的工具——App、邮件、日历、任务管理、文件存储——越可能先被改写。越复杂、越强权限的系统会更慢,但也更依赖“前端入口+权限+工作流编排”这个组合。
GenAI和Agent不是两个时代,是同一个系统的两层。ChatGPT的对话框定义了GenAI的交互模式,OpenClaw的聊天软件定义了Agent的交互模式。前者最终会隐去,变成后端。OpenClaw这样的Agent成为一切的前端。
1
难得的自下而上的“革命”
这股热潮没有褪去背后,另一个让人有些意外的地方是,OpenAI“收编”了OpenClaw后,人们的热情并没有减弱。
但这也因为,OpenAI挖走了OpenClaw的创始人,但到现在也没推出类似的产品形态。
这可能因为ChatGPT的对话框心智太强,三年多积累的用户习惯反而成了负担。而且OpenAI的商业模式建立在订阅和API调用上,让Agent跑在第三方聊天软件里,等于把用户入口拱手让人。
Anthropic的处境同样特殊。Claude Code增长很快,但“编程工具”标签一旦贴上就撕不掉。Cowork是对的棋子,一月份发布即引发一波软件股恐慌,但它生在桌面端、不在聊天软件里,起步慢了半拍。
同一时期,Perplexity推出了名为Computer的super agent,走云端路线但定位类似——这说明“主动式Agent嵌入日常工具”已成行业共识,区别只在谁先拿到用户。
这些巨头面对的其实是同一个困境:现有产品太成功了,反而堵住了解决真正的需求的路。ChatGPT的对话框、Claude Code的终端、Office的生产力套件、微信的社交生态——每一个都是护城河,但也是围墙。OpenClaw没有这个包袱。巨头们被自己的成功困在原地,不是看不见新范式,而是动不了。
看起来,人们对OpenClaw和收了它的OpenAI的认知依然是分开的,OpenClaw代表的新的交互范式,没有对“自有入口”的执念反而把用户体验做好了,而一个好的“前端”从来都是自下而上建设起来的。
这也让OpenClaw成了这一轮越来越像是巨头之间的资源游戏的AI演进中,一次难得的自下而上的破局。它给了大批开发者和创业者一些新的信心:创新还可以发生,哪怕是从一个小团队、一个周末项目、一个“surprise me”的粗暴提示词开始,游戏还远远没有结束。