扫码打开虎嗅APP
本文来自微信公众号:超梦一场,作者:超梦一场,题图来自:视觉中国
这篇文章仅试图让更多人理解OpenClaw为什么这么火热,以及So what?
不折腾——不是部署指南,如果又菜又爱玩,推荐买个云服务一键部署。
不瞎**吹——并没有什么技术革命发生,只是一场“工程”的胜利。
不制造焦虑——小龙虾不会让你失业,也确实没能力养活不想努力的你。
一、“出圈”话题回顾
一小部分人是真兴奋,其他人一直在“震惊”。
“半夜接到OpenClaw助理打来的电话。” ——AI已经会自己摸索出如何打电话,主动汇报进度,堪比真人助理。
“OpenClaw帮自己做量化交易。”——专业又不知疲倦的牛马,感觉分分钟就要赚爆。
“OpenClaw甚至自己组建了多智能体团队自动跑通了跨境电商全流程” ——不仅替代你,整个公司都不存在了。
......诸如此类,还有更离谱的就不罗列了。
这些听起来很科幻的说法,其实都源于OpenClaw的slogan:“The AI That Actually Does Things”。
能让AI“真的去做事儿”,内置的能力可以做到清理你的收件箱、发送邮件、管理日历、办理登机……再加上茫茫多的Skills可以不断拓展“能力边界”,可以做的事情越来越多。截至目前ClawHub上已经有9118个Skills,可以粗暴的理解为这1~2个月小龙虾新增可处理事项多了接近1万个,况且由于各种原因ClawHub并没有包含所有Skills,小龙虾可以做的事只多不少。

github上awesome-openclaw-skills精选了几千个Skills,更重要的是感受一下“丰富”的分类。

预防针:制作Skills门槛很低,随着热心群众的涌入,数量暴涨。所以过几天就算听说“一亿个Skills”的时候也别慌,好用的也还是那些。
OpenClaw第一次把AI的能力具象化成了各行各业的人都可“看见”的自动化流程。人们终于直观地感受到:原来AI真的可以帮我干这么多事,而又不禁暗想:“我的工作难道真的要被AI替代了?”
再加上“AI自动操作电脑”的演示视频:你看着浏览器窗口/或各种应用自己打开、点击、输入、翻页……整个过程像是有个幽灵在操作键盘。对于非技术人员来说,这种视觉冲击力是致命的。
真想做事(产品定位)+ 真能做事(丰富的Skills生态)。
焦虑感 + 好奇心,构成了OpenClaw出圈的核心动力。
所以OpenClaw到底是什么?为什么它能做这些事?它真的那么神奇吗?
二、能力拆解
朴实无华的缝合怪:

OpenClaw官网展示的能力
OpenClaw的能力其实挺朴素,依次说说我个人的一点理解:
1. 在您的机器上运行
这是OpenClaw最基础也是最核心的特性:整个系统可以跑在你自己的电脑上,数据、配置、会话记录都在本地。
对于想要隐私可控的用户来说,这似乎是真正的私人助理。
另外,小龙虾、羊驼组合:OpenClaw + Ollama 看起来也是浑然天成。安装好 Ollama,拉取一个本地模型,然后通过命令ollama launch openclaw。
设置好OpenClaw的模型调用配置,你就拥有了一个完全不需要消耗云端 token 的 AI 助手。
对于想要省钱的人来说,这还是个免费助理。
当然,Mac Mini可以尝鲜(已卖断货),但小龙虾的“发明者”Peter Steinberger用的是 Mac Studio,顶配 512GB 内存版本。几千的Mac mini可能无法承载你的梦想。

你的硬件水平决定了你助理的智力水平。
2. 任何聊天应用程序

OpenClaw 支持的消息渠道列表长得让人眼花缭乱,国内微信、钉钉、飞书……也都支持(有的便捷、有的麻烦)。
它接进你已经在用的IM,把所有接收到的消息转换成它自己能理解的格式,处理完再给你发回去。你用飞书发消息,它就从飞书回你;你用微信发消息,它就从微信回你。
这有什么特别的?以前的AI都被锁在自己的应用/体系内,锁在豆包、锁在千问、锁在元宝……;以前你需要打开某个“盒子”与AI见面,现在它如影随形。
真的体验到AI通过聊天软件联系到自己时,那种类似电影“打破次元壁”的感受,还是挺惊喜的。你想,你刷着抖音,突然微信弹出一个消息:“我刚刚帮你查了一下,你那支股票跌了3%,要不要卖掉?”
这感觉确实有点魔幻。
3. 持久性记忆
每次对话继承历史信息,这解决了很多 AI 聊天工具的通病:聊得再好,下次见面又是陌生人。
那它是怎么解决的喃? OpenClaw 的记忆系统会把对话中的关键信息记录下来,储存为文档。下次你问相关问题,它会从这些历史记录文档里检索相关信息。
但你看一下记忆存储的文档,感受下有多“朴素”。

OpenClaw的“记忆”文档 - 真就是事无巨细的挨着记

OpenClaw的“用户”文档 - 专属于你的“舔狗”
你会发现就是一些简单的 Markdown 文档(除了以上2个文档还有更多,一样的逻辑 就不展开),里面记录了对话的要点和上下文。不是什么新的技术,也不是小龙虾第一个这么做。
“MEMORY.md”文档记录你的事务;
“USER.md”文档记录你的个性/喜好;
主打一个好记性不如烂笔头。
4. 浏览器控制
这是 OpenClaw 最引人注目的能力之一。它能打开浏览器、访问网页、点击按钮、填写表单、截图、提取内容……

自动打开浏览器 -> 加载网页 -> 获取信息
这有什么用?以上图为例,我要求 OpenClaw 去看看今日头条都有些什么新闻。它会:
打开浏览器;
访问今日头条;
读取页面内容;
提取文章标题和摘要 ;
整理成一份总结发给我。
整个过程是自动的,你不需要做任何操作。对于围观群众来说,这就像是AI学会了“上网” ——而非以前 AI 只能“抓取”。
现在它能像人一样交互。但这个能力也有风险:如果 OpenClaw 在浏览器里乱点,可能会触发一些意想不到的操作(比如不小心把你写的文章删了)。所以官方建议配置沙盒环境或者用非工作电脑,与你工作/生活的电脑做好物理隔离。
你说这个能力有多神奇?以前很多工具也能实现,但本质在于。
以前的实现方法多为“硬”编码,你写了什么它就能做什么,但是现在有一点“智能”的意思了(但不多)。
比如它甚至可以一定程度理解网页内容,因为根据“记忆”知道我喜欢体育,就主动点击了“体育专栏”,给我汇报的新闻主要以体育新闻为主。
5. 完整的系统访问权限
OpenClaw能读取你电脑里的文件、访问系统信息、操作终端、甚至调度应用……只要你敢给他开权限。

实际还不止以上权限 - 你的密码、地址、交易信息、社交账号等。
这是OpenClaw和其他 AI 助手最大的区别,也是它最大胆的地方。
虽然说大家习惯了“自愿”用隐私换取便利。但是假设豆包问你要以上权限,你会给吗?大概反手就是卸载。
换句话说,它不是一个人畜无害的陪聊,它是真的能让你有种刀口舔血的感觉。
好处是:它能干其他AI助手可能干不了的事,比如: 识别短期低风险套利机会,并帮你形成执行方案、甚至直接操作。
坏处是:它能让你付出的代价也是其他AI助手比不了的。如果它某个环节出了差错,可能会让你真金白银的亏。
所以这里必须再次强调:非要玩,搭配沙盒或者非工作电脑。
6. 技能和插件
这是 OpenClaw 真正强大的地方。
Skills越多,能做的事就越多。
正因为OpenClaw的Skills生态急剧爆炸,推高了热度,热度越高,Skills生态又越爆炸……左脚踩右脚,造就了无所不能的小龙虾。
Skills 不是什么高科技,本质上就是给 AI 看的“技能说明书”。每个技能对应一个 Markdown 文件(SKILL.md),里面写明了:
这个技能能做什么;
如何调用这个技能;
需要什么参数;
有什么注意事项。
我拿调用Trello的Skill举例。一个创建卡片的方法,一个移动卡片的方法,和我们熟悉的调用接口/API并没有本质区别。

来源 - https://clawhub.ai/steipete/trello
另外,目前Skills正面临严重的安全问题。因为其“松散”的结构且缺乏监管审核,大量skill携带恶意代码,潜在的破坏力惊人。clawhub为了改善局面已经与VirusTotal合作,对skill进行安全扫描。

插一个话题:技术界的新宠、高大上的Skills竟然这么low,地位和实力严重不匹配?
个人看法:Skills是AI发展的过渡产物,但又和始祖鸟一样意义重大。

这个世界过去几十年的技术积累,都是面向程序员的;AI如此强悍的当下,却没有面向AI的积累。不得不用Skills这样的方式把给程序员看的API转换为AI可用的技能。
Skills会存在多久?面向AI的积累最终是什么样的?我不知道,但让人期待。
三、有何不同
别人问我小龙虾最厉害的是什么?我怎么回答?
现在让我们回到最关键的问题:OpenClaw 这个产品和其他 AI 工具到底有什么不同?
不是微信给你发消息,也不是什么半夜给你打电话。这些只是一个“发送和接收消息的通道”,不重要。甚至你完全不配置任何沟通渠道也是可以的,自带的面板/控制台与AI交互不影响任何功能。
也不是组建了什么 AI 团队帮你完成一个公司的运转,这种多智能体的系统可以说现在市面上的所有AI工具都有。
Skills也不是,它并不是OpenClaw的专属,其他AI工具也可以使用。
OpenClaw 的核心产品差异在于:从“高谈阔论”到“交付最终结果”。

传统的 AI 工具是这样的:
你问问题;
AI 给你建议;
你自己动手去执行;
遇到问题再问 AI;
AI 再给你建议 ……
OpenClaw 是这样的:
你给一个任务;
AI 自己拆解问题 ;
AI 自己探索解决方案;
AI 自己调用工具执行;
AI 自己验证结果;
AI 把最终结果交给你。
这中间最大的区别是什么?是“中间环节”。
传统 AI 的中间环节是“对话”:你问,AI 答,你再问,AI 再答……整个过程充满了“来回交互”,但问题到底解决了吗?不一定。有时候你问了半天,最后还是得自己动手。
OpenClaw 的中间环节是“自问自答”:它自己问自己,自己答自己,自己验证,自己调整。你可能只给了一句指令,但在后台,它已经经过了“左右脑互搏”一二十个回合,最终把结果交给你。
这不是某一个功能点所达成的,它是一个自洽的体系。

这种能力是怎么来的?有三个核心要素:
全知 - 最全渠道/类型信息OpenClaw 有多种信息来源:完整的系统访问权限、浏览器自主查询、Skills 带来的信息获取渠道:能调用各种 API 和外部服务。 OpenClaw 在解决问题时,它需要什么信息,就去获取什么信息,而不是一直问你“这个是什么?那个怎么选?”
全能 - 无数的手和脚OpenClaw 得益于最强的Skills生态,OpenClaw 不只是“能想”,更是“能做”。它不需要你替它操作,它自己就能动手。当然,不管你想完成什么任务,初次的搭建、调试还是难免的。
主动拆解问题这是最关键的一点。OpenClaw 有一个“主动拆解问题”的逻辑。 看一下 OpenClaw 的 System Prompt,会发现它其实不复杂:
Task Decomposition Rules
Understand the user's intent
Break down the task into sub-tasks
Identify required tools and skills
Execute sub-tasks sequentially
Verify results and adjust if needed
Deliver final output
就这几条规则,加上一些提示词工程,就构成了 OpenClaw 的“大脑”。没有什么复杂的算法,就是一套清晰的“思考框架”。
但这个框架威力巨大:它让 AI 知道“怎么去解决问题”,而不是“怎么去回答问题”。
四、问题
但“美好”体验的背后,也有一些短时间难以克服的问题。
1. 延迟
正因为 OpenClaw 会“自问自答”拆解问题,所以随便一句话可能都左右脑互搏几十个回合,一个复杂任务(比如“我下个月准备去西安,帮我规划一下行程”),OpenClaw 可能需要经过10~20次 API 调用,每次都带着完整的上下文,整个过程可能要等上好几分钟。
并且因为“高”延迟,也限制了应用场景。想让小龙虾帮你打游戏?连连看可以。
2. Token消耗量巨大
蝴蝶效应,又因为“左右脑互搏”,导致一个问题消耗几万~几十万 token 如同家常便饭,轻松帮你把云服务给你干到欠费。悖论诞生:本地部署免费用,但是弱智;云服务模型强更聪明,用不起。
但对于云服务厂商倒是重大利好,算力变现的风来了,还很大。
让我们看一组数据:
场景
传统AI助手
OpenClaw
3. 糟糕的结果
AI 解决问题的通病 OpenClaw 同样有,比如幻觉、错误理解、逻辑漏洞……就不赘述了。
这里想说的是:主动拆解问题的过程,有时候看着它左右脑互搏真能把你逗笑。
举个例子:你问它吃什么健康又省钱,最后告诉你“喝白水”。

类似传话游戏的滑稽感
这种“拆解”在简单任务中可能没问题,但在复杂任务中,一步拆解错误,后面就全错了。
让我们定义一个变量,来表示OpenClaw在主动拆解问题的过程中,单步骤的正确率。
“单次问题拆解正确率”,最终用来“估算”全程拆解正确的“最终正确率”。
假设 OpenClaw 单次问题拆解正确率是 90%,那么:
10步拆解 最终正确率:0.9^10 = 34.9% 正确
20步拆解 最终正确率:0.9^20 = 12.2% 正确
垃圾级,本地跑的小参数模型大体如此
如果单次问题拆解正确率是 95%:
10步拆解 最终正确率:0.95^10 = 59.9% 正确
20步拆解 最终正确率:0.95^20 = 35.8% 正确
玩具级,复杂问题的回答似是而非
如果单次问题拆解正确率是 99%:
10步拆解 最终正确率:0.99^10 = 90.4% 正确
20步拆解 最终正确率:0.99^20 = 81.8% 正确
工具级,顶级模型,但出错概率也不小
这就是指数折扣效应。每一步拆解都可能引入误差,而这些误差会随着拆解步骤的增加而指数级放大。
单次问题拆解正确率99%的模型存在吗?有哪些?我没有去论证,但是大家依据日常使用AI的体感,应该有自己的答案。
五、未来
虽然有这么多问题,但用发展的眼光看,OpenClaw 还是让我们看到了未来产品形态的一种可能性。
1. “新”设备
未来,随着设备性能提升,甚至可能出现完全为本地部署模型而设计的个人设备,本地部署的模型会越来越强。
“本地模型智力堪忧”的问题会逐渐解决。
更重要的是,未来的交互形态可能会发生根本性变化。
未来的手机可能没有App,不再需要频繁地与屏幕交互。你只需要说一句话,AI 就会帮你完成所有操作,打开应用、填写信息、执行任务这些过程只存在于AI与AI or API交互的黑盒里,屏幕的作用不再是“操作”界面,而仅仅是“呈现必要的结果”。
如果再加上一个脑机接口,话都不用说,起心动念之间任务就已传达,结果又自动传回脑内,屏幕都不用看。画面太美……脑机接口是另一个话题了,以后有机会再讲。
2. 更强的模型 + 更便宜的算力
模型的进步速度是极快的,逻辑推理能力与推理速度日新月异,“单次问题拆解正确率”如果能做到 0.9999 甚至 0.99999,那么AI对于复杂问题的最终拆解正确率以及速度会远超人类。
过去几年 Token 价格价格已经“一落千丈”,未来 Token 价格可能下降 100 倍甚至 10000 倍也几乎是必然发生。
Token成本一定不会是“私人助理”普及的瓶颈。
3. 真正的全记忆、全权限
现在 OpenClaw 的记忆和权限还比较粗粒度,把大部分都交给了模型“发挥”。
未来,大概率会出现“
个人信息“可信空间”:你的所有数据(文档、邮件、聊天记录、日程、偏好……)都集中管理,能让 AI 安全且可控的访问和利用,实现真正的全记忆。
个人权限管理中枢:你能精确控制 AI 能访问什么、不能访问什么,什么时候能访问。并且不需要复杂的操作设置,大部分能自动化完成。最重要的是智能判断权限授予对于完成任务是否必要,且不会引发问题。
依托于此,你敢把自己交出去,真正有灵魂的私人助理才会出现。
六、结语

OpenClaw 让我们看到了未来的可能性,但它现在还不够好。
平常心,随着AI的浪潮静观其变。不是弄潮儿,还不能在沙滩上看看吗?
大可不必为营销号的鼓吹而焦虑烦躁。

一个“惊人”的效果 + 一堆词汇串联 = 造谣
本文来自微信公众号:超梦一场,作者:超梦一场