扫码打开虎嗅APP
本文来自微信公众号:零一怎么看,作者:余子申,原文标题:《从 Claude Cowork 引发的软件股暴跌,看 AI落地的“红线”与“死穴”》,头图来自:AI生成
最近,资本市场发生了一次极具戏剧性的价值重估。
随着 Claude Cowork 等具备跨应用操作能力的 AI Agent 正式发布,华尔街迅速用脚投票。一夜之间,Salesforce、Adobe、ServiceNow 等深耕垂直行业的传统企业软件巨头,股价遭遇重挫。
资本的逻辑简单且粗暴:既然 AI 已经进化成了数字员工(Agent),不仅能精准理解意图,还能直接接管电脑、读取本地文件、跨越多个应用执行复杂任务,那么企业就不再需要雇佣那么多初级员工了。既然操作软件的人锐减,那些按“人头”(Seat)收费的 SaaS 软件,自然也就卖不出订阅账号了。
沿着这条线推演,传统软件的商业模式似乎危在旦夕。
这种论调听起来无懈可击,但它其实是一种把个人工具体验直接外推到复杂组织系统的类比错误。华尔街看到了大模型在单点任务和个人桌面上的惊艳表现,却完全误判了 B 端业务流转的底层逻辑。Claude Cowork 确实是一个能力出众的开路先锋,但把一个优秀的“个人助理”等同于一条运转精密的“企业流水线”,是对商业常识的严重匮乏。
真实的商业世界,远比一个对话框复杂得多。Agent 想要真正敲开核心业务的大门,面临的绝不仅是技术参数的挑战,而是必须跨越企业管理中的红线与死穴。
一、核心分野:C 端在“抽卡”,B 端在“炼钢”
为什么惊艳的 Agent 一旦脱离个人电脑,进入企业的核心生产线,就会立刻水土不服?
根本原因在于,C 端个人用户与 B 端企业组织,对于“好结果”的定义完全处于两套不同的坐标系:C 端在“抽卡”,而 B 端在“炼钢”。
个人拥抱 AI,玩的是一场高容错率的概率游戏。
当你使用 AI 去生成一张海报、写一段文案或者规划一份行程时,你本身就是“容错率”的最大受益者。你可能需要重新生成 9 次废稿,才能换来第 10 次的神来之笔,但这 9 次试错的成本几乎为零。
更重要的是,在 C 端场景下,标准是“流动的”。如果 AI 给出的图片虽然不符合你最初的设想,但效果却出奇地好,你甚至可以顺着 AI 的结果去修改自己的原意。
但企业组织的运转,是“一致性”的绝对信徒。
在真实的工业化交付与商业流转中,企业不需要 120 分的偶然惊喜,它需要的是 10,000 次 85 分的绝对稳定。
企业的标准是刚性的、不可妥协的。操作说明书里写了什么,产出的结果就必须严格对齐什么。偏离一个像素、错位一个标点、少了一个数据校验节点,在 C 端叫瑕疵,在 B 端就是生产事故。
只要 AI 还在玩概率抽卡的游戏,它在企业管理者的眼里,就永远是一个充满不确定性的危险变量。
二、Agent 迟迟敲不开企业大门的“三大隐形成本”
许多技术乐观派认为,只要给公司的每个员工都配备一个类似 Claude Cowork 的 Agent,企业的整体运营效率就能实现指数级翻倍。
然而,一旦把这种“概率性生产力”真正接入复杂的企业协作网络中,就会立刻暴露出极其高昂且致命的隐形成本。这些成本在简单的 Demo 演示中看不见,却在真实的业务流转中如影随形。
隐形成本一:输入的方差
无论是多么强大的 Agent,现阶段其本质依然是等待指令的工具(Copilot)。只要是工具,其最终的产出质量就极度依赖操作者的个人水平。
在一个企业内部,员工的能力、经验以及对任务上下文的理解参差不齐。同样的业务目标(例如“汇总近期的行业舆情”),资深业务主管和刚入职的新员工给出的提示词(Prompt)必然截然不同。输入端的巨大方差,必然导致 Agent 输出结果的南辕北辙。
企业管理的本质,是消除人为不确定性,建立标准作业程序(SOP)。如果一项核心业务的产出质量,只能建立在“这个员工提示词写得好不好”这种个人玄学上,这对于系统性运转的企业来说,是一场灾难。
隐形成本二:被严重忽视的“质检税”
这或许是当前企业引入 AI 时踩过的最大的坑。
在抽卡模式下,员工让 Agent 自动跨软件处理了 50 份文件,生成了一份业务报告,表面上看耗时仅需 10 秒钟,效率奇高。但这 50 份文件在业务主管眼里,全变成了“薛定谔的交付物”。
大模型存在幻觉,且黑盒作业的过程极不透明。为了确保这份由 Agent 生成的报告没有捏造数据、没有遗漏关键条款、没有在跨应用操作时覆盖掉重要的历史记录,员工或主管必须花费大量的时间,去逐一核对原始文件。
在一大堆由机器生成的废料中,反复甄别、比对、找错,其带来的认知负担甚至高于人工从头做起。机器生成的时间确实省下来了,但背后暴增的“筛选与质检税”,往往让这项业务的整体 ROI(投资回报率)由正转负。
隐形成本三:无法回溯的“信任税”
商业决策是一项严肃的活动,其核心要求是证据闭环与责任可追溯。
个人用户看到 AI 给出一个看似专业的回答,会惊呼“好聪明”。但当这份 AI整理的报告被放在企业高管的决策会议上时,高管只会问几个犀利的问题:“这组数据是从哪几个原始系统里提取的?引用出处在哪里?你的推导逻辑是什么?如果这个决策导致了亏损,谁来为这句话负责?”
如果一个结论无法向下击穿,追溯到底层的客观事实,它就无法进入真正严肃的商业决策链条。这种因为证据断层带来的“信任税”,是阻碍 Agent 进入企业深水区的又一壁垒。
三、Agent 与 SaaS 的生死线:2×2 边界矩阵
讨论 Claude Cowork 究竟会不会干掉传统软件,我们永远不应该去问“这个模型现在的跑分有多高”,而是必须回归业务本身的属性。
真实的商业世界,可以被两个独立且相互正交的核心坐标轴精准切分:
横轴:失败成本,从低到高。它衡量的是业务的“Rollback(撤回)成本”——也就是这项业务如果做错了,是否具有可逆性?是否会引发法律、财务、品牌等不可挽回的外部性后果?
纵轴:可治理性,从低到高。它衡量的是业务的“控制面强度”——也就是这项任务是否天然要求强审计日志、复杂的审批流、严密的权限管控以及不容篡改的刚性口径?

有人可能会问,失败成本高的事情,难道不是自然要求高治理吗?两者是否重复?
并非绝对。
当我们把这两个坐标轴交叉,就会发现一些极具杀伤力的“盲区”。把企业的各项业务放进这个 2×2 的边界矩阵里,AI 与 SaaS 的替代迷雾将瞬间散去:
① 低治理 × 低失败成本 = C 端“抽卡区”
特征:验收标准高度主观,没有严苛的审计压力。错了可以随时重做,撤回成本极低。
结局:这是 Agent 最容易直接替代传统软件“操作面”的区域。在这个象限里,用户的目的就是快速试错、寻找灵感。
场景:营销海报初稿设计、短视频粗剪、个人会议笔记、内部头脑风暴脚本。
观点:允许方差,因为撤回廉价。华尔街的狂热,正是因为他们只看到了这个象限里的惊艳表现。
② 低治理 × 高失败成本 = 高风险“黑箱禁区”
特征:这是最容易被忽视的陷阱。业务本身往往处于系统治理的边缘(缺乏硬性的系统合规管控),但一旦出错(哪怕是微小的幻觉),付出的代价将是灾难性的。在这里,前文提到的“信任税”与“复核成本”将呈现指数级爆发。
结局:企业高管和法务会本能地拒绝让纯 Agent 在这里“裸奔”。除非先通过系统手段补齐底层的“控制面”,否则 AI 绝对无法在此落地。
场景:重要的对外公关新闻稿定稿、包含关键商业承诺的邮件自动回复、重大价格表或合同条款的自动生成。
观点:高风险无治理,是 AI 落地的死胡同。
③ 高治理 × 低失败成本 = B 端“可控自动化区”
特征:业务具备清晰的审计标准、统计口径和责任链条。同时,即使中间处理环节出现偏差,也能在内部流转中被及时拦截撤回,外部影响可控。
结局:这是 AI 真正能够在 B 端大放异彩的温床。Agent 会被大量采用,但它的存在形式绝不是“单飞”,而是被死死嵌在系统工作流里。它必须服从系统的调度与规则约束。
场景:竞品动态的日常监测初筛、行业情报的结构化提取、多渠道内容分发的编排、内部 IT 工单的自动摘要与分流。
观点:这里才是“可控 AI”真正能规模化的地方。
④ 高治理 × 高失败成本 = B 端控制面主战场
特征:企业生存的绝对红线。要求强审计、强合规、强责任,且错误绝对不可承受。这里是企业对抗“质检税”的核心阵地。
结局:在这个绝对刚性的地盘里,Agent 永远不可能取代系统。它不仅不会干掉 SaaS,反而只会退化为系统中的一个底层执行器(Actuator)。真正的赢家,是掌控全局、制定规则的控制面(传统软件,或新一代的自动化流程底座)。
场景:上市公司财报数据的提取与核对、金融交易与风控审批流程、医疗处方开具与安全审查、政府监管报送系统。
观点:护城河从交互界面,彻底转移到了控制面。
四、跳出Agent 崇拜,回归工程常识
通过上述的矩阵拆解,我们再回过头来看华尔街对 SaaS 软件的看空,就会发现其逻辑的脆弱性。
市场恐慌,是因为他们误以为软件的价值仅仅是“提供一个让人点鼠标的操作界面”。如果大模型能自动点鼠标、自动完成任务了,软件自然就死了。
但他们忽略了,支撑庞大商业帝国运转的,从来不是左下角那些轻盈的“操作界面”,而是矩阵右侧那些死板、刚性、绝不妥协的控制与规则。
传统企业软件,以及未来新一代的企业级自动化平台,其真正的护城河是“确定性”与“可控性”。
在真实的商业交付中,企业不需要 AI 帮忙配一段听起来很宏大的音乐,企业需要的是一段指定的、绝对无版权争议的 BGM;企业不需要 AI 排版得“很有设计感”,企业需要的是严格遵守 VI 视觉红线、使用特定的品牌字体。
大模型和 Agent 带来了极强的创造力和变量,但企业运转的基石是边界约束和常量。软件的护城河,正是这道拦截 AI 天马行空的合规红线与规则护栏。它不提供灵感,它只提供约束。
这一波汹涌的 AI 浪潮,上半场是模型大厂们的军备竞赛,比拼的是参数规模、Token 长度和基础智商。
但这仅仅是 C 端的狂欢。
真正决定商业胜负的下半场,已经进入了 B 端的深水区。在这里,比拼的不再是模型有多聪明,而是工程交付能力。
是如何将隐性的业务经验抽取成刚性的系统规则;是如何建立完善的审计日志和人工兜底机制;是如何把 AI 这头充满野性与不确定性的野马,牢牢套上“控制面”的工业化缰绳。
企业需要的,从来不是发给每个员工一个随时随地陪聊、充满偶然惊喜的超级助理。企业真正渴求的,是一条输入输出绝对确定、消除个体方差、规则被彻底固化的“数字流水线”。
抛开参数迷信,回归工程常识。当全行业都在为 Agent 狂欢时,谁能率先在企业内部建立起高治理、强控制的“确定性管线”,谁才能真正吃下这波 AI 时代最大的产业红利。
本文来自微信公众号:零一怎么看,作者:余子申