OpenClaw到底是个什么事儿-虎嗅网

本文来自微信公众号：超梦一场，作者：超梦一场，题图来自：视觉中国

这篇文章仅试图让更多人理解OpenClaw为什么这么火热，以及So what？

不折腾——不是部署指南，如果又菜又爱玩，推荐买个云服务一键部署。
不瞎**吹——并没有什么技术革命发生，只是一场“工程”的胜利。
不制造焦虑——小龙虾不会让你失业，也确实没能力养活不想努力的你。

一、“出圈”话题回顾

一小部分人是真兴奋，其他人一直在“震惊”。

“半夜接到OpenClaw助理打来的电话。” ——AI已经会自己摸索出如何打电话，主动汇报进度，堪比真人助理。

“OpenClaw帮自己做量化交易。”——专业又不知疲倦的牛马，感觉分分钟就要赚爆。

“OpenClaw甚至自己组建了多智能体团队自动跑通了跨境电商全流程” ——不仅替代你，整个公司都不存在了。

......诸如此类，还有更离谱的就不罗列了。

这些听起来很科幻的说法，其实都源于OpenClaw的slogan：“The AI That Actually Does Things”。

能让AI“真的去做事儿”，内置的能力可以做到清理你的收件箱、发送邮件、管理日历、办理登机……再加上茫茫多的Skills可以不断拓展“能力边界”，可以做的事情越来越多。截至目前ClawHub上已经有9118个Skills，可以粗暴的理解为这1～2个月小龙虾新增可处理事项多了接近1万个，况且由于各种原因ClawHub并没有包含所有Skills，小龙虾可以做的事只多不少。

github上awesome-openclaw-skills精选了几千个Skills，更重要的是感受一下“丰富”的分类。

预防针：制作Skills门槛很低，随着热心群众的涌入，数量暴涨。所以过几天就算听说“一亿个Skills”的时候也别慌，好用的也还是那些。

OpenClaw第一次把AI的能力具象化成了各行各业的人都可“看见”的自动化流程。人们终于直观地感受到：原来AI真的可以帮我干这么多事，而又不禁暗想：“我的工作难道真的要被AI替代了？”

再加上“AI自动操作电脑”的演示视频：你看着浏览器窗口/或各种应用自己打开、点击、输入、翻页……整个过程像是有个幽灵在操作键盘。对于非技术人员来说，这种视觉冲击力是致命的。

真想做事（产品定位）+ 真能做事（丰富的Skills生态）。

焦虑感 + 好奇心，构成了OpenClaw出圈的核心动力。

所以OpenClaw到底是什么？为什么它能做这些事？它真的那么神奇吗？

二、能力拆解

朴实无华的缝合怪：

OpenClaw官网展示的能力

OpenClaw的能力其实挺朴素，依次说说我个人的一点理解：

1. 在您的机器上运行

这是OpenClaw最基础也是最核心的特性：整个系统可以跑在你自己的电脑上，数据、配置、会话记录都在本地。

对于想要隐私可控的用户来说，这似乎是真正的私人助理。

另外，小龙虾、羊驼组合：OpenClaw + Ollama 看起来也是浑然天成。安装好 Ollama，拉取一个本地模型，然后通过命令ollama launch openclaw。

设置好OpenClaw的模型调用配置，你就拥有了一个完全不需要消耗云端 token 的 AI 助手。

对于想要省钱的人来说，这还是个免费助理。

当然，Mac Mini可以尝鲜（已卖断货），但小龙虾的“发明者”Peter Steinberger用的是 Mac Studio，顶配 512GB 内存版本。几千的Mac mini可能无法承载你的梦想。

你的硬件水平决定了你助理的智力水平。

2. 任何聊天应用程序

OpenClaw 支持的消息渠道列表长得让人眼花缭乱，国内微信、钉钉、飞书……也都支持（有的便捷、有的麻烦）。

它接进你已经在用的IM，把所有接收到的消息转换成它自己能理解的格式，处理完再给你发回去。你用飞书发消息，它就从飞书回你；你用微信发消息，它就从微信回你。

这有什么特别的？以前的AI都被锁在自己的应用/体系内，锁在豆包、锁在千问、锁在元宝……；以前你需要打开某个“盒子”与AI见面，现在它如影随形。

真的体验到AI通过聊天软件联系到自己时，那种类似电影“打破次元壁”的感受，还是挺惊喜的。你想，你刷着抖音，突然微信弹出一个消息：“我刚刚帮你查了一下，你那支股票跌了3%，要不要卖掉？”

这感觉确实有点魔幻。

3. 持久性记忆

每次对话继承历史信息，这解决了很多 AI 聊天工具的通病：聊得再好，下次见面又是陌生人。

那它是怎么解决的喃？ OpenClaw 的记忆系统会把对话中的关键信息记录下来，储存为文档。下次你问相关问题，它会从这些历史记录文档里检索相关信息。

但你看一下记忆存储的文档，感受下有多“朴素”。

OpenClaw的“记忆”文档 - 真就是事无巨细的挨着记

OpenClaw的“用户”文档 - 专属于你的“舔狗”

你会发现就是一些简单的 Markdown 文档（除了以上2个文档还有更多，一样的逻辑就不展开），里面记录了对话的要点和上下文。不是什么新的技术，也不是小龙虾第一个这么做。

“MEMORY.md”文档记录你的事务；

“USER.md”文档记录你的个性/喜好；

主打一个好记性不如烂笔头。

4. 浏览器控制

这是 OpenClaw 最引人注目的能力之一。它能打开浏览器、访问网页、点击按钮、填写表单、截图、提取内容……

自动打开浏览器 -> 加载网页 -> 获取信息

这有什么用？以上图为例，我要求 OpenClaw 去看看今日头条都有些什么新闻。它会：

打开浏览器；
访问今日头条；
读取页面内容；
提取文章标题和摘要；
整理成一份总结发给我。

整个过程是自动的，你不需要做任何操作。对于围观群众来说，这就像是AI学会了“上网” ——而非以前 AI 只能“抓取”。

现在它能像人一样交互。但这个能力也有风险：如果 OpenClaw 在浏览器里乱点，可能会触发一些意想不到的操作（比如不小心把你写的文章删了）。所以官方建议配置沙盒环境或者用非工作电脑，与你工作/生活的电脑做好物理隔离。

你说这个能力有多神奇？以前很多工具也能实现，但本质在于。

以前的实现方法多为“硬”编码，你写了什么它就能做什么，但是现在有一点“智能”的意思了（但不多）。

比如它甚至可以一定程度理解网页内容，因为根据“记忆”知道我喜欢体育，就主动点击了“体育专栏”，给我汇报的新闻主要以体育新闻为主。

5. 完整的系统访问权限

OpenClaw能读取你电脑里的文件、访问系统信息、操作终端、甚至调度应用……只要你敢给他开权限。

实际还不止以上权限 - 你的密码、地址、交易信息、社交账号等。

这是OpenClaw和其他 AI 助手最大的区别，也是它最大胆的地方。

虽然说大家习惯了“自愿”用隐私换取便利。但是假设豆包问你要以上权限，你会给吗？大概反手就是卸载。

换句话说，它不是一个人畜无害的陪聊，它是真的能让你有种刀口舔血的感觉。

好处是：它能干其他AI助手可能干不了的事，比如：识别短期低风险套利机会，并帮你形成执行方案、甚至直接操作。

坏处是：它能让你付出的代价也是其他AI助手比不了的。如果它某个环节出了差错，可能会让你真金白银的亏。

所以这里必须再次强调：非要玩，搭配沙盒或者非工作电脑。

6. 技能和插件

这是 OpenClaw 真正强大的地方。

Skills越多，能做的事就越多。

正因为OpenClaw的Skills生态急剧爆炸，推高了热度，热度越高，Skills生态又越爆炸……左脚踩右脚，造就了无所不能的小龙虾。

Skills 不是什么高科技，本质上就是给 AI 看的“技能说明书”。每个技能对应一个 Markdown 文件（SKILL.md），里面写明了：

这个技能能做什么；
如何调用这个技能；
需要什么参数；
有什么注意事项。

我拿调用Trello的Skill举例。一个创建卡片的方法，一个移动卡片的方法，和我们熟悉的调用接口/API并没有本质区别。

来源 - https://clawhub.ai/steipete/trello

另外，目前Skills正面临严重的安全问题。因为其“松散”的结构且缺乏监管审核，大量skill携带恶意代码，潜在的破坏力惊人。clawhub为了改善局面已经与VirusTotal合作，对skill进行安全扫描。

插一个话题：技术界的新宠、高大上的Skills竟然这么low，地位和实力严重不匹配？

个人看法：Skills是AI发展的过渡产物，但又和始祖鸟一样意义重大。

这个世界过去几十年的技术积累，都是面向程序员的；AI如此强悍的当下，却没有面向AI的积累。不得不用Skills这样的方式把给程序员看的API转换为AI可用的技能。

Skills会存在多久？面向AI的积累最终是什么样的？我不知道，但让人期待。

三、有何不同

别人问我小龙虾最厉害的是什么？我怎么回答？

现在让我们回到最关键的问题：OpenClaw 这个产品和其他 AI 工具到底有什么不同？

不是微信给你发消息，也不是什么半夜给你打电话。这些只是一个“发送和接收消息的通道”，不重要。甚至你完全不配置任何沟通渠道也是可以的，自带的面板/控制台与AI交互不影响任何功能。

也不是组建了什么 AI 团队帮你完成一个公司的运转，这种多智能体的系统可以说现在市面上的所有AI工具都有。

Skills也不是，它并不是OpenClaw的专属，其他AI工具也可以使用。

OpenClaw 的核心产品差异在于：从“高谈阔论”到“交付最终结果”。

传统的 AI 工具是这样的：

你问问题；
AI 给你建议；
你自己动手去执行；
遇到问题再问 AI；
AI 再给你建议 ……

OpenClaw 是这样的：

你给一个任务；
AI 自己拆解问题；
AI 自己探索解决方案；
AI 自己调用工具执行；
AI 自己验证结果；
AI 把最终结果交给你。

这中间最大的区别是什么？是“中间环节”。

传统 AI 的中间环节是“对话”：你问，AI 答，你再问，AI 再答……整个过程充满了“来回交互”，但问题到底解决了吗？不一定。有时候你问了半天，最后还是得自己动手。

OpenClaw 的中间环节是“自问自答”：它自己问自己，自己答自己，自己验证，自己调整。你可能只给了一句指令，但在后台，它已经经过了“左右脑互搏”一二十个回合，最终把结果交给你。

这不是某一个功能点所达成的，它是一个自洽的体系。

这种能力是怎么来的？有三个核心要素：

全知 - 最全渠道/类型信息OpenClaw 有多种信息来源：完整的系统访问权限、浏览器自主查询、Skills 带来的信息获取渠道：能调用各种 API 和外部服务。 OpenClaw 在解决问题时，它需要什么信息，就去获取什么信息，而不是一直问你“这个是什么？那个怎么选？”
全能 - 无数的手和脚OpenClaw 得益于最强的Skills生态，OpenClaw 不只是“能想”，更是“能做”。它不需要你替它操作，它自己就能动手。当然，不管你想完成什么任务，初次的搭建、调试还是难免的。
主动拆解问题这是最关键的一点。OpenClaw 有一个“主动拆解问题”的逻辑。看一下 OpenClaw 的 System Prompt，会发现它其实不复杂：

Task Decomposition Rules
Understand the user's intent
Break down the task into sub-tasks
Identify required tools and skills
Execute sub-tasks sequentially
Verify results and adjust if needed
Deliver final output

就这几条规则，加上一些提示词工程，就构成了 OpenClaw 的“大脑”。没有什么复杂的算法，就是一套清晰的“思考框架”。

但这个框架威力巨大：它让 AI 知道“怎么去解决问题”，而不是“怎么去回答问题”。

四、问题

但“美好”体验的背后，也有一些短时间难以克服的问题。

1. 延迟

正因为 OpenClaw 会“自问自答”拆解问题，所以随便一句话可能都左右脑互搏几十个回合，一个复杂任务（比如“我下个月准备去西安，帮我规划一下行程”），OpenClaw 可能需要经过10～20次 API 调用，每次都带着完整的上下文，整个过程可能要等上好几分钟。

并且因为“高”延迟，也限制了应用场景。想让小龙虾帮你打游戏？连连看可以。

2. Token消耗量巨大

蝴蝶效应，又因为“左右脑互搏”，导致一个问题消耗几万～几十万 token 如同家常便饭，轻松帮你把云服务给你干到欠费。悖论诞生：本地部署免费用，但是弱智；云服务模型强更聪明，用不起。

但对于云服务厂商倒是重大利好，算力变现的风来了，还很大。

让我们看一组数据：

场景
传统AI助手
OpenClaw

3. 糟糕的结果

AI 解决问题的通病 OpenClaw 同样有，比如幻觉、错误理解、逻辑漏洞……就不赘述了。

这里想说的是：主动拆解问题的过程，有时候看着它左右脑互搏真能把你逗笑。

举个例子：你问它吃什么健康又省钱，最后告诉你“喝白水”。

类似传话游戏的滑稽感

这种“拆解”在简单任务中可能没问题，但在复杂任务中，一步拆解错误，后面就全错了。

让我们定义一个变量，来表示OpenClaw在主动拆解问题的过程中，单步骤的正确率。

“单次问题拆解正确率”，最终用来“估算”全程拆解正确的“最终正确率”。

假设 OpenClaw 单次问题拆解正确率是 90%，那么：

10步拆解最终正确率：0.9^10 = 34.9% 正确

20步拆解最终正确率：0.9^20 = 12.2% 正确

垃圾级，本地跑的小参数模型大体如此

如果单次问题拆解正确率是 95%：

10步拆解最终正确率：0.95^10 = 59.9% 正确

20步拆解最终正确率：0.95^20 = 35.8% 正确

玩具级，复杂问题的回答似是而非

如果单次问题拆解正确率是 99%：

10步拆解最终正确率：0.99^10 = 90.4% 正确

20步拆解最终正确率：0.99^20 = 81.8% 正确

工具级，顶级模型，但出错概率也不小

这就是指数折扣效应。每一步拆解都可能引入误差，而这些误差会随着拆解步骤的增加而指数级放大。

单次问题拆解正确率99%的模型存在吗？有哪些？我没有去论证，但是大家依据日常使用AI的体感，应该有自己的答案。

五、未来

虽然有这么多问题，但用发展的眼光看，OpenClaw 还是让我们看到了未来产品形态的一种可能性。

1. “新”设备

未来，随着设备性能提升，甚至可能出现完全为本地部署模型而设计的个人设备，本地部署的模型会越来越强。

“本地模型智力堪忧”的问题会逐渐解决。

更重要的是，未来的交互形态可能会发生根本性变化。

未来的手机可能没有App，不再需要频繁地与屏幕交互。你只需要说一句话，AI 就会帮你完成所有操作，打开应用、填写信息、执行任务这些过程只存在于AI与AI or API交互的黑盒里，屏幕的作用不再是“操作”界面，而仅仅是“呈现必要的结果”。

如果再加上一个脑机接口，话都不用说，起心动念之间任务就已传达，结果又自动传回脑内，屏幕都不用看。画面太美……脑机接口是另一个话题了，以后有机会再讲。

2. 更强的模型 + 更便宜的算力

模型的进步速度是极快的，逻辑推理能力与推理速度日新月异，“单次问题拆解正确率”如果能做到 0.9999 甚至 0.99999，那么AI对于复杂问题的最终拆解正确率以及速度会远超人类。

过去几年 Token 价格价格已经“一落千丈”，未来 Token 价格可能下降 100 倍甚至 10000 倍也几乎是必然发生。

Token成本一定不会是“私人助理”普及的瓶颈。

3. 真正的全记忆、全权限

现在 OpenClaw 的记忆和权限还比较粗粒度，把大部分都交给了模型“发挥”。

未来，大概率会出现“

个人信息“可信空间”：你的所有数据（文档、邮件、聊天记录、日程、偏好……）都集中管理，能让 AI 安全且可控的访问和利用，实现真正的全记忆。

个人权限管理中枢：你能精确控制 AI 能访问什么、不能访问什么，什么时候能访问。并且不需要复杂的操作设置，大部分能自动化完成。最重要的是智能判断权限授予对于完成任务是否必要，且不会引发问题。

依托于此，你敢把自己交出去，真正有灵魂的私人助理才会出现。

六、结语

OpenClaw 让我们看到了未来的可能性，但它现在还不够好。

平常心，随着AI的浪潮静观其变。不是弄潮儿，还不能在沙滩上看看吗？

大可不必为营销号的鼓吹而焦虑烦躁。

一个“惊人”的效果 + 一堆词汇串联 = 造谣

本文来自微信公众号：超梦一场，作者：超梦一场

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

OpenClaw到底是个什么事儿