扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-03-03 17:50

OpenClaw 让每个聊天软件都有机会变成微信

本文来自微信公众号: APPSO ,作者:发现明日产品的


2月春节期间,机器人满天飞的时候,Manus发布了personal agent,首发平台选了Telegram,而非自家的WhatsApp。



与此同时,Salesforce在1月宣布新版Slackbot正式上线,定位为「你的个人工作agent」;飞书开放平台上线了AI Agent工作流节点和MCP工具支持;Discord社区里,AI bot的数量和复杂度也在急速攀升。


这当然要拜OpenClaw所赐,作为仅一个周末就涨到10万GitHub star、增长最快的AI开源项目之一,它的默认交互界面不是网页,不是独立客户端——是Telegram。



一个清晰的趋势正在形成:即时通讯工具正在从「人与人的对话」变成「人与AI的接口」,聊天软件意外地迎来了它们的「第二春」。


但「第二春」并非平等地降临在每一寸土地上。不同IM平台的开放程度、技术架构和治理逻辑差异巨大,它们在agent浪潮中的位置也截然不同。理解这些差异,需要一条分析线索——开放性的天平。


为什么是聊天软件?


为什么是即时通讯软件?打开自己生活里最常用的对话框,就可以使唤AI——这非常符合人类对「科技生活」的畅想。不过,真正的答案,跟agent的架构有关。


AI agent的工作原理并不复杂:监听用户指令,交给AI处理,再把结果返回。这个「消息进—处理—消息出」的循环,天然适配即时通讯的基础设施——长连接、实时推送、富文本消息。聊天软件在过去十几年里为人类对话打造的管道,几乎不需要改造就能供agent使用。



更重要的是human-in-the-loop的需求。当前的AI agent远不到完全自主的程度,它在执行关键操作之前——比如发一封邮件、修改一段代码——往往需要人类点头确认。聊天窗口里的一个回复,比打开一个新的管理后台、登录一个新的dashboard要自然得多。IM天然就是一个「确认/驳回」的界面。


还有一个更决定性的因素:用户已经住在聊天软件里了。不需要下载新App,不需要学习新界面,agent就在你每天打开的对话列表里,夹在同事群和家庭群之间。这种零迁移成本,是任何独立AI产品都很难复制的优势。对于开发者来说,这意味着获客成本趋近于零——你不需要说服用户安装任何东西,只需要让他们点一下「添加bot」。


但并非所有聊天软件都平等地受益于这波趋势,决定谁先吃到agent红利的关键变量,是平台的开放程度。我们可以沿着一条从「完全开放」到「完全封闭」的光谱,来观察各家IM平台的位置和策略。


天平最左端:Telegram


Telegram之所以成为agent浪潮的第一个受益者,不是因为它最大、最好用,而是因为它是所有主流IM里开发者门槛最低的。


创建一个Telegram bot只需要跟@BotFather对话几步——起个名字,拿到API token,就可以开始接收和发送消息。不需要企业认证,不需要审批流程,不需要等待人工review。整个过程从零到一个能跑的bot,可以在5分钟内完成。



这种「零摩擦」不仅仅是注册环节的便利。Telegram的Bot API设计本身就非常开发者友好:webhook机制让bot可以实时响应消息,inline模式让bot可以在任何对话中被唤起,支持markdown和HTML的富文本渲染让agent可以返回结构化的输出。


更关键的是,Telegram对bot的功能限制极少——bot可以创建群组、管理频道、处理支付等一系列操作,最近的更新还支持了对bot的流式输出。这种「bot能做的事几乎等于人能做的事」的设计哲学,让开发者有极大的发挥空间。



OpenClaw选择Telegram作为第一交互渠道,正是因为这种开放性。在OpenClaw的官方文档里,Telegram是第一个被详细说明的频道,配置教程最完整,社区讨论最活跃。一个典型的OpenClaw用户,可以在一台VPS上部署agent实例,绑定自己的Telegram bot token,然后通过对话窗口让agent帮自己完成从信息检索到代码部署的一系列任务。



Manus在今年2月选择Telegram作为首发平台,逻辑类似。Meta旗下的产品没有选择自家的WhatsApp——后者有着超过20亿的月活用户——而是选了用户量远小于它的Telegram,足以说明在agent早期阶段,开放性比用户基数更重要。WhatsApp的通过Baileys库,需真实手机号验证,Business API审核流程复杂、不支持商业大规模部署,对于一个需要快速迭代的AI产品来说,摩擦太大了。


但Telegram的开放性是一把双刃剑。


同一种让开发者能够零门槛创建bot的开放性,也让Telegram长期成为灰色产业的温床。安全公司Bitsight在今年1-2月的扫描中发现了超过30000个暴露在公网上的OpenClaw实例,最新出现的一个「曝光看板」中,暴露数量来到了惊人的22万个,许多实例的API密钥和数据库凭证直接暴露在默认配置里,安全形同虚设。




这是一个悖论:让agent生态最快繁荣的条件,恰恰也是让安全风险最快积累的条件。而且,这个问题无法通过「加强审核」简单解决——因为审核本身就意味着提高门槛,而低门槛正是开发者选择Telegram的原因。


天平中间:Slack与Discord


如果说Telegram代表的是「先上车后买票」的野路子,Slack和Discord则代表了两种不同风格的「有限开放」。


Slack走的是企业级路线,通过Bolt框架,和开发工具深度集成。2026年1月,Salesforce宣布新版Slackbot正式上线,面向Business+和Enterprise Grid用户,定位「your personal agent for work」——支持查找信息、分析文档、管理日程、生成摘要。



同月,Salesforce还推出了Agentforce在Slack中的集成,将CRM数据和客户交互直接引入对话流。Slack对第三方agent的态度是开放但可控:所有bot需要经过Marketplace审核,数据访问有明确的OAuth scope限制,企业管理员可以精细控制哪些bot能进入哪些频道。


Discord的bot生态同样成熟,但底色更偏社区和创作者。开发者需要在Developer Portal注册应用、配置权限(比Telegram的@BotFather多几步),但远不到企业级IM的审核强度。Discord的agent优势在于社区场景的密度:Midjourney从Discord bot起家,如今大量AI项目仍然以Discord作为用户社区和产品交互的双重入口。OpenClaw本身也在Discord上运营活跃的开发者社区。



两者的共同点是:它们都在开放性上设了一个「限速器」。Slack的限速器是企业合规,Discord的限速器是社区治理。相比Telegram的完全放任,这意味着agent生态的发育速度慢一些,但系统性风险也低一些。


天平向右:飞书


对于国内用户来说,飞书是一个值得单独拿出来讨论的案例。它的开放方式,反映了中国IM平台在agent浪潮中的独特情况。


飞书的开放平台在过去一年里经历了显著的能力升级。2025年下半年起,飞书陆续上线了Bot API的多项增强、工作流(Workflow)中的AI Agent节点(目前为Beta)、以及对MCP(Model Context Protocol)工具集的支持。在GitHub上,飞书官方维护的lark-openapi-mcp项目已获得超过400颗star,提供了飞书核心功能的MCP Server封装。OpenClaw也有官方的飞书插件(@openclaw/feishu),支持将agent部署到飞书对话中。



从功能层面看,飞书的agent基础设施正在快速追赶——bot可以读写文档、支持发送带按钮、表单的交互式卡片、触发审批流、创建和管理日历事件,这些都是企业场景下agent的高价值能力。


但飞书的开放性有两重限制:


第一重是平台治理。飞书的agent生态天然是B2B的,而非Telegram那种C2C加B2C的混合形态。飞书的bot需要在企业应用框架内运行——开发者需要创建企业自建应用或商店应用,配置权限后需要企业管理员审批。这意味着个人开发者很难像在Telegram上那样「5分钟创建一个bot」。



一个直观的对比:一个Telegram开发者从注册bot到收到第一条消息回复,整个过程不超过5分钟;同样的事情在飞书上,光是等待企业管理员审批应用权限就可能需要一个工作日。


企业级管控带来了更高的安全性,但代价体现在开发者体验上:权限配置、调试、上线等环节的摩擦显著高于Telegram,这种摩擦不是缺点而是特点——但它确实减缓了agent生态的自发生长速度。


第二重是生态位。在中国市场,飞书的主要竞对是钉钉和企业微信。三者都在加码agent能力,但路径不同:钉钉倾向于与通义系列大模型深度绑定,企业微信则依托微信生态的用户基数。



一个有意思的现象是:尽管中国IM市场高度碎片化,在agent这件事上率先跑出来的既不是用户基数最大的企业微信,也不是市场份额最高的钉钉,而是飞书。


这完全是偶然吗?不一定。


第一,飞书的开放平台不是后来加的一层皮,而是产品基因的一部分——多维表格本身就是可编程的数据层,文档原生支持API读写,这些底层设计让agent的接入成本比竞品更低。



第二,字节跳动同时拥有大模型能力(豆包/云雀)和企业协作平台,这种垂直整合让飞书在agent场景下的迭代速度更快;相比之下,钉钉和通义、企业微信和混元之间的组织协调链条更长。


第三,飞书的客户画像偏向互联网和科技企业——这批企业本身开发者密度更高、自动化需求更强、对AI的接受度也更高,agent生态更容易在这个群体中形成冷启动。


当然,这也意味着飞书的agent故事目前主要是一个「科技公司圈内叙事」,能否向更广泛的企业市场渗透仍然是问号。


这个案例还折射出另一件事:agent中继不太可能由一个创业公司从零做出来——agent需要的不只是消息管道,还需要企业内部的数据、权限和工作流,这些是现役IM玩家的护城河。


另外,中国市场的IM格局更碎片化,agent开发者需要同时适配多个平台,这增加了生态成形的难度,因此存量优势便很有决定性。


以中国市场来看,IM的「第二春」不仅取决于开放性,还取决于与本土大模型的集成深度、企业客户的采购逻辑、以及监管环境对bot能力边界的定义。这是一个和全球市场显著不同的竞争维度。


天平背后


开放性的天平,揭示的不只是各家IM的策略差异,而是一个agent时代的基础矛盾:平台越开放,agent生态越繁荣,安全风险也越高。


Telegram是这个矛盾的极端表达。同一种让开发者能够零门槛创建bot的开放性,同时打开了创新和滥用的大门。如果监管收紧迫使Telegram提高bot创建门槛——这并非不可能,被法国警方制裁后,Telegram已经开始调整部分内容政策——那么会影响到开发者吗?他们又会迁移到哪里?Discord、Slack、还是飞书?


然而,封闭平台面临相反的困境:不开放API就错过agent红利,但开放了又要承担Telegram正在经历的安全和声誉成本。WhatsApp在技术上,完全有能力做一个类似@BotFather的轻量工具,但它背后是20亿用户,不能不多加考虑。


现在,每个IM平台,都需要在这个天平上寻找自己的位置。「第二春」能持续多久,取决于一个至今没有标准答案的问题:在agent时代,一个聊天平台应该多开放?


在开放性之争的背后,一个更激进的猜想正在开发者社区成形:当一个聊天窗口可以调用任意agent完成从订票、编程到数据分析的任意任务时,它已经不只是一条管道——它正在变成一个超级接口。


要说不说,这个逻辑对中国读者而言,很眼熟啊——这不就是微信吗。


微信用小程序、支付和政务服务,在一个封闭生态里实现了「一个App解决一切」。而OpenClaw所代表的模式指向一个镜像式的可能:用开放生态和全球开发者社区,在任意一个IM里实现类似的功能密度。


不是再造一个微信,而是用完全相反的路径——开放而非封闭,去中心化而非平台主导——最终抵达一个功能上相似的终点。


当然,这仍然只是一个猜想,而非预言。微信super app的成立依赖于中国市场独特的移动支付基础设施和用户习惯,这些条件在全球市场并不通用。更根本的是,开放生态能否在不牺牲安全性的前提下达到那种服务密度,目前没有人能给出答案。


但如果这个方向是对的,那么IM的「第二春」就不仅仅是一段插曲,潜在地,这会是一次身份转换的起点:从消息管道,到AI时代的通用交互层。谁先在开放性和安全性之间找到那个可持续的平衡点,谁就最有可能定义这个新物种的样子。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: