扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
中国AI Agent发展进入新阶段,从"懂你"的Copilot到"替你"的API编排,再到"先于你"的AI-native Agent,OpenClaw和MiniMax分别代表了第二类和第三类的探索,但真正实现跃迁需要解决行动能力、系统接入、社会底座等结构性挑战。 ## 1. OpenClaw爆红背后的市场逻辑 - 满足中国市场对"单人能力放大器"的强烈需求,企业、个人、政府都在寻找AI+新抓手 - 扩散方式体现中国特色:先验证实用价值而非概念认同,通过安装服务、教程、企业试用快速普及 - 让用户首次意识到AI价值从"答案"转向"动作",从"你问我答"升级为"你说我办" ## 2. 第二类Agent的本质与演进方向 - OpenClaw属于API Orchestration范式,本质是重组现有能力而非创造新能力 - 同类产品分工差异:OpenClaw是开放编排层,Manus展示执行过程,CoPaw是模块化工作台 - 关键演进方向是透明化"替你"的过程,需实现动作可视化、可追溯,目前内部agent已覆盖MiniMax近90%员工场景 ## 3. 第三类Agent的三大门槛 - MiniMax展现第三类雏形:具备主动性萌芽(如Talkie主动问候)、全模态路线、内部AI组织试验 - 但未跨过关键门槛:目标驱动的主动发现能力不足,缺少现实行动闭环,2C底座尚未完善 - Kensho在金融垂直领域更接近第三类,体现"主动发现问题+边界内行动"核心能力 ## 4. 实现跃迁的四大结构要素 - 行动能力:需稳定工具调用、多agent协同,而不仅是长上下文 - 系统接入:第二类API编排是第三类的基础前提 - 社会底座:消费场景需法律/伦理框架,垂直领域需规则引擎/风控体系 - 认知驱动:要超越规则触发,实现未声明需求的主动发现与边界内行动
2026-03-18 00:08

“养虾”之后,AI Agent如何跃迁?

本文来自微信公众号: 秦朔朋友圈 ,作者:汪潇


这几个月,中国AI圈最有戏剧性的一幕,不在实验室,也不完全在资本市场,而在一个原本带有极客色彩的开源项目身上。


一只“龙虾”突然红了!它真正点燃的,不只是流量,而是一种新的预期:AI也许已经不再只是“会说”,而开始进入“会做”的阶段。


但真正值得追问的,不是OpenClaw火不火,而是它到底代表了什么。它是不是很多人口中的Agent时代已经到来?


如果把今天AI Agent的演进压缩成一句话,大概可以这样概括:


第一类是Copilot,核心是“懂你”;


第二类是API Orchestration,核心是“替你”;


第三类是AI-native Agent,核心则是“先于你”。


问题是,“先于你”从来不是一个功能点,而是一个结构问题。


OpenClaw为什么突然火了


首先,它击中了中国市场对“单人能力放大器”的强烈需求。企业在降本增效,个人在寻找超级个体路径,地方政府在找“AI+”的新抓手,平台在找新的分发入口。OpenClaw恰好站在这些力量的交叉点上。它让很多人第一次直观看到:AI不只是陪聊、写文案、做图,也可以替你整理邮件、调度日程、串起工作流。它不再只是“会说话的模型”,而是“开始会办事的代理人”。



其次,它的扩散方式很有中国市场特征。它不是先靠宏大发布会出圈,而是先靠“能不能用、值不值钱、能不能帮我干活”扩散。安装服务、教程、云端接入、企业试用一起出现,说明这类产品的普及,不是先从概念认同开始,而是先从动作价值开始。


第三,它让很多人第一次感受到:AI的价值不在答案,而在动作。过去两年,大模型的典型关系是“你问,我答”;OpenClaw往前推了一格:你说,我办。前者是经验,后者才开始接近真正的生产率工具。


然而,近几日频频出现的警示类报道,如流量资金消耗、动作失误、敏感目录访问、数据泄露、越权访问和被攻击风险等,表明了三个问题:


第一,安全问题已经从模型答错,升级为真实动作失控。


第二,AI越能办事,越需要边界。


第三,开源繁荣与社会治理之间的张力,已经提前到来。


所以,OpenClaw的火,不只是一个工具爆红,而是一次认知转换。AI的下一轮竞争,不只是模型会不会说,而是能不能真正替人调动系统和世界。


为什么说OpenClaw属于第二类


很多人看到OpenClaw能调邮箱、调日历、调浏览器、调系统,就容易直接把它置于“真正自主智能”的位置上。


但更准确地说,它属于第二类,也就是API Orchestration/接口式编排范式。


第二类AI的本质,不是创造新能力,而是把既有能力重新组织起来。用户之所以觉得它“全能”,并不是因为它自己什么都会,而是因为它把原本散落在日历、邮件、支付、浏览器、数据库和工具链里的能力,重新编成了一条更顺的动作链。


所以第二类AI给用户的核心感受是:


更省心,更全能。


OpenClaw、Manus、CoPaw:同属第二类,但分工不同。


把OpenClaw、Manus、CoPaw放在一起看,会更清楚。


OpenClaw更像“开放编排层”。它擅长把聊天入口、工具、模型和系统连起来,本质上像底盘、像接线板。


Manus更像“第二类的产品完成态展示”。它把任务拆解、工具调用、执行过程做得更可见,所以更容易让用户直观感受到“一个AI真的在替我工作”。


CoPaw则更像“平台型工作台”。它强调多渠道接入、模块化、可控、本地或云部署,更像一台工程化的个人agent控制台。


而这三者放在一起,会导出第二类下一步最重要的一个方向:


第二类AI的演进,不只是越来越会替你做事,还要越来越向用户透明化、可视化“它究竟怎样替你做事”。


为什么这点重要?


因为一旦agent真正连系统、走流程、发动作,用户自然会问:它刚才调了哪些系统?哪一步是我授权的?哪一步是它自己判断的?如果错了,我怎么回退?


Manus更容易被理解,恰恰就在于它把“替你”的过程做得更可见。


所以第二类真正成熟的标志,不只是“替你”,而是把替你的过程做成可视、透明、可追溯。


第三类在哪里


如果说OpenClaw让我们看到了第二类的突然具象化,那么MiniMax则代表了中国公司里最有野心的一种尝试:从模型公司走向平台公司,再向第三类AI-native Agent逼近。


MiniMax最值得看的,不只是产品线,而是它对自己位置的清醒。


闫俊杰有几句话非常关键。他说,像海螺AI这种智能助手“其实是没有定义的”“我们的产品都是撞出来的”;


他又提出MiniMax要从一家模型公司迈向“AI时代的平台型公司”,并把平台价值概括为:


智能密度×Token吞吐量。


这几句话放在一起,其实表达得很清楚:


MiniMax知道行业形态还没稳定,也知道单靠用户数并不能定义未来,它真正想做的是一个可持续输出智能的平台。


为什么说它在逼近第三类?


第一,它已经出现了主动性的萌芽。Talkie/星野这类产品已经不只是被动等你说话,而会主动发起问候、调用长期记忆,且根据你的情绪和上下文调整互动。


第二,它走的是全模态路线。语言、视频、语音、音乐一起做,意味着它并不想停在文本对话层,而是想建立更完整的智能底座。闫俊杰明确说过,多模态融合是持续提升智能的基本前提。


第三,它已经把自己当作AI-native组织试验场。内部agent覆盖近90%员工日常工作场景,员工正在从“教Agent如何工作”转向“观察Agent如何工作”。这说明AI在MiniMax这里,不只是产品,也在变成一种组织方式。


但为什么又说它还没到?


因为第三类真正成立,不只要“更主动”,还要跨过三道坎。


第一,主动性还不够深入。今天MiniMax的主动性更多还是场景内主动性,比如主动问候、主动延续对话,而不是目标驱动的主动发现。


真正的第三类,应该能基于你的状态、日程、行为变化,发现你没有显式说出口的问题。


第二,它还缺少现实行动闭环。MiniMax的很多亮点仍然主要停留在虚拟空间里的认知增强和内容生产,而第三类真正的关键,是能不能跨平台、跨系统、跨现实动作形成闭环。


第三,也是最关键的一点:它还没有真正完成2C底座。真正的第三类AI不可能裸奔。在消费场景里,它必须建立在法律规则、伦理边界、平台制度、个体授权和风险治理之上。MiniMax自己其实已经意识到了这一点,并明确提到“构建完善的2C底座,是向更高阶AI Agent演进的必经之路”。


所以,对MiniMax最准确的评价不是“已经是第三类”,而是:它已经具备第三类的技术前兆、产品倾向和组织意图,但还没有完成第三类所要求的主动性深度、现实行动闭环,以及社会化底座整合。


MiniMax与Kensho:一个在逼近第三类,一个更接近第三类的局部现实


如果要给MiniMax找一个更有启发性的对照对象,我认为是Kensho。


因为Kensho更接近第三类的定义本身。它的价值不在于更会聊天,而在于更擅长在高价值垂直场景中整合多源信息、发现人类未显式提出的问题,并在边界内实施动作。


这也是它与MiniMax最重要的差别。


MiniMax更像通用能力平台向第三类逼近的冲刺者。它的优势在于广,在于它想覆盖更普遍的用户世界和更通用的agent场景。


Kensho则更像垂直高价值场景里的“第三类局部完成态”。它不一定有更强的大众产品心智,但在特定行业里更接近“主动发现问题+边界内行动”这一核心。


换句话说:


MiniMax更像“面向第三类的通用冲刺者”;Kensho更像“在垂直场景里更接近第三类的先行样本”;但两者也有一个非常关键的共性问题。


那就是:它们都不能只靠模型和agent本身成立。


只要AI开始从“替你做”走向“先于你发现并行动”,就都会碰到同一个根本问题:


谁来托底?


对MiniMax,这个问题表现为2C底座。它必须知道什么能做、什么不能做、什么要二次确认、什么涉及隐私、财务、伦理和未成年人边界。


对Kensho,这个问题表现为行业底座。在金融复杂决策场景里,它同样不能裸奔,而必须建立在规则引擎、数据治理、知识图谱、权限控制、风控与审计之上。


所以,MiniMax和Kensho虽然分属不同赛道,一个更通用,一个更垂直,但它们最终都指向同一个结论:


第三类AI不是模型问题,而是底座问题。


结语:真正到达第三类,还缺什么


OpenClaw让我们看见了第二类的爆发,MiniMax让我们看见了第三类的轮廓,但从第二类通向第三类,真正缺的不只是更强模型,而是更完整的结构。


这个结构至少包括四个要素:


第一,有更强的行动能力。


不是更长上下文,而是更稳定的工具调用、搜索、记忆、计划和多agent协同能力。


第二,有更深的系统接入能力。


第二类不会被第三类消灭,反而会成为第三类的前提。没有API Orchestration,第三类只能空转。


第三,有更成熟的2C底座或行业底座。


在消费场景中,需要法律、伦理、授权和风险治理;在高价值垂直场景里,需要规则引擎、知识图谱、风控与审计。就如同在工业场景里,这个结构会越来越像一个整合工业物理、工艺规则、设备状态、管理逻辑和权限控制的“泛工软平台”。没有底座,第三类AI就只能聪明,无法可靠。


第四,要从“规则触发”走向“认知驱动”。


不仅仅是更积极主动一点,而是真的能在持续互动中发现问题、提出你没说出口的需求,并在边界内采取动作。


这就如同你是需要一个仅仅能说会道、调动情绪的伙伴,还是一个能够踏实做事、始终陪伴、坚定可靠,同时又能及时发现甚至解决问题,与你产生真正有价值互补性的伙伴群体?


也就是说,真正的第三类,不是一个更自动化的工作流,也不是一个更会聊天的助手,而是一种新的行动基础设施。


所以,今天看OpenClaw,不该只看到热度;看MiniMax,也不该只看到估值和产品线。


真正应该看到的,是这条越来越清晰的进化链:


从懂你,


到替你,


再到先于你。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: