扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-02-26 08:33

别被OpenClaw 带偏了,AI 公司到底该如何组织团队?

本文来自微信公众号: 叶小钗 ,作者:叶小钗,原文标题:《别被 OpenClaw 带偏了,AI 公司到底该如何组织团队?》


最近OpenClaw火得一塌糊涂,与之前Manus爆火带动的团队“哲学”一致,于是他也被作为一个经典的创业成功案例被不断宣传,于是乎


一人公司、精英团队


等团队构架策略被再次提了出来,我整理了下大概观点:


未来的伟大AI公司,不应该像传统的互联网大厂(层级制、项目制、OKR驱动),而应该像一家“科技对冲基金”(数据驱动、极端透明、超高激励)


整个观点拆开,会分解为一套执行方法论:


一、人才标准极高


这里第一点其实就很苛刻,这里要招的是


“一人成军”


的人。衡量标准是的三个灵魂拷问:


  1. 能自己写策略(Prompt/算法)吗?


  2. 能自己解读A/B测试结论吗?


  3. 能在一天内把实验写完、测完并上线吗?


所以,这里找的是


“产品+技术+策略”


三位一体的复合型人才,而不是流水线上的螺丝钉(这里包括某个小领域的专家)。


二、去中心化


在组织结构上,要摒弃多层级而追求“项目制”,这里的项目制其实就是以小团队(10人内)为核心的独立执行单元,拥有极高的自治权,爱干什么干什么,但


要对结果负责



并且,对于同一个课题,也不用开会争论谁是负责人了,直接采用赛马机制,谁愿意做谁去做,直接1-4个项目组同步进行,谁牛逼选谁;最后结果谁好就选谁,然后给到谁更多的资源。


失败的项目组重新回归流量池,等待再启动。


这里可能是问题最大的所在,我们后面再说明



三、重度奖励


传统的互联网公司奖励延迟太过,无论你多优秀,都至少要等两轮考核,最终奖励体现在年终或者述职考核上。这给了各个Leader人太多的操作空间,可能会导致小团体和优秀的人被打压,最终的结果就是大家积极性降低。


项目制的解法是:


重奖励,并且实时奖励、现金奖励,让你的多巴胺直接拉爆


!比如你帮公司赚了一个亿,那么公司就给你一千万,绝不拿期权来和稀泥。


这个策略的核心就是最大化激活优秀的员工,并且保证优秀的员工能够拿到应有的奖励。


如何评价


这套方法论的底层逻辑是:既然AI Agent时代,优秀人才和一般人员的差距会进一步拉大,产品迭代周期也会变得越来越快,所以公司的运转机制应该从


慢周期变成快周期、并且更加重视实时数据反馈



怎么说呢?这个观点本身是很美好的,但实际执行效果不太好,你可能会质疑,为什么你会知道呢?因为,在之前公司,我当初刚好是这套机制的设计参与者和实际执行者。这里有一段故事......


unsetunset创新之殇unsetunset


前老板是我见过最执着于创新的人,可以说将创新刻进了公司的基因,之前为了倡导公司创新,我们设计了一套名为“创作吧”的产品大赛机制,大概运转方式是:


  1. 公司层面给一些课题;


  2. 公司所有人都可以根据这些课题做方案来竞标;


  3. 参与创作吧的优先级高于业务,意思是可以因为参与创新而放下手里的事;


  4. 竞标成功会获得丰厚奖金,并且已经立项的项目各种倾斜资源做执行,我记得有小伙伴一次竞标成功获得了不少于10万的奖金(3个月工资左右),后续也受到了足够的重用;


  5. 活动每个月一次,会对正在执行的项目进行复盘,也会开展新的课题;


为表真实性,下面是当时报名用到的模板:



当时为了鼓励大家参与,还做了很多文化层面的建设:


那是一段美好的时光,可以说他满足了我对一家科技公司的所有想象,足够公平的给所有人机会,每个有才华的人都可以获得资源去实现自己的方案。


那么这里问题就来了,整个机制最后执行的如何呢?答案是


初期很好,但中期一般,后期疲软


,这里也就回到鼓吹OpenClaw这类一人公司最大的问题了:


多数公司,包括大公司的人才密度是难以支撑这套机制的



以我们当时接近一年的执行情况来说:


表现得好的总是那批人,总是那批总监及以上的人,创作吧最后似乎成了他们独立的舞台


,所以你说这套机制拿到了多少创新产品不好说,但一定是让很多人才冒了头。


最后,老板手里面已经有足够的“好手”使用的情况下,加之跟战略相关的课题多数都在执行了,于是整体公司会沉静下来,进入很长一段时间的执行期。


这里有句话不得不提:虽然AI时代的迭代周期变快了,但你千万不要以为一个产品没有经过半年的市场打磨就可以生存,就可以真正被用户认可吧?


比如,因OpenClaw而爆火的社交论坛产品Moltbook,这东西噱头是拉足了的,


他只允许Agent在里面发文章,掀起了一股让人类给Agent打工的“热潮”


但:


  1. 这东西他真的经过市场验证吗?


  2. 他的生存周期会超过半年吗?


  3. 他发的东西有人去看吗?


  4. 你看了的东西会相信吗?


  5. 你因为什么去看的,猎奇还是想看看AI的可能性?


  6. ......


这里的核心点是:想要靠一个憋出爆款去打动市场很难,对于公司来说,踏踏实实做业务才是常态,而且整体机制长时间执行下去的


管理问题也是巨大


,包括公平性,包括如何去评价、如何去定价、如何去考核等等问题。


总而言之,做个小而美的产品有可能,想做一个服务千万人的战略级产品,那是真难!


这里可能有同学会杠两个点:


第一,


人才密度不足那就招足够优秀的人不就好了



如果有这个疑问的同学,大概率没做过总监以上的管理,首先就我所见的公司,只要优秀的人扎堆的公司,坐在一起第一件事可能不是“共同促进”,更容易或者一定会发生的反而是互相内耗!


这属于经济学原理的范畴了,一个团队资源是有限的,互相的影响力是有限的,你把这么多厉害的雄性关在一个公司,他们做的第一件事是证明我是老大,有些人做不了老大,就会换个地方做老大!


难道OpenAI给的年薪不够高吗,他们的理想不够激动人心吗,那些年薪上亿的人为什么要离职?


说白了也就不过是:


他们不按我说的去做!


这么一件小事罢了


解决了“高端人士”内耗的问题后(比如给出足够的课题),才是一般公司该面临的噩梦:


课题是有限的,我为一个项目要养2-3个团队的人力成本,我是傻了吗?


并且在公司体系下,一定会有很多扮演高手的庸才,他们会在各种项目里面划水,这批东郭先生是不太好发现的,怎么解决、怎么防止他们从中作梗也是问题,这批人有个特点,做撒撒不成,但他们吃撒撒不剩啊!


基于此,一般团队想要达到精英团队,人人创新是很难的,之前B站直播团队在国内互联网公司至少是第二梯队,你让他们提出点牛逼点的OKR都费劲,何况其他公司呢?


他们是更没有那个思维能力滴,还是那句话:


创新是少数人的游戏,并且这批人还不能扎堆,扎堆只能内耗



第二,


OpenClaw难道还不够战略级



怎么说呢?也许“OpenClaw这类产品真还不够有用”。


首先,这东西我们之前详细聊过了:他并没有创新什么东西,他是现有技术的再排列组合,并没有超出Manus太多。


并且只是以OpenClaw为例,他本身也是开源的,大家可以自己去看看代码,实现成本不太高的,但要明确说的,他的实现非常优雅,要做好也很难!


并且,


这类产品真正的成本会发生在后期


,包括不断膨胀、难以控制的Token成本、安全问题、运维成本、部署成本等。


换个说法,在OpenClaw没推出多久,其可能竞品就已经很多了,包括大家推崇的Manus、Perplexity Assistant、Rabbit...


或者说,国内已有Agent产品公司,稍微改造下就可以强制说自己是他的竞品......


综上,精英团队愿望虽好,但实际执行很难,真实做好了的其实更可能是


有限精英团队,否则Manus、OpenClaw为什么不在OpenAI这家公司产生呢?


所以最终结论,我是不是反对那种精英团队呢,答案是否定的,我反而很赞同;其次这里真实的问题是当前AI Agent团队应该如何构建,这个各位老板都一定关注的问题,毕竟时代在变啊!


unsetunsetAI团队组织结构unsetunset


首先,关于AI团队架构应该如何设计这个问题,还是要回归问题的本质


这个团队到达要去做什么,以及这个项目的难点是什么


,大家要明白,就算是AI项目,不同类型对团队要求是不一样的,比如:


工作流类AI核心是KnowHow是如何梳理出完整的SOP,AI反而是其中的配角,这种应用里面AI的含量不会超过20%,可以将其归属到降本增效类AI,做起来马上就会有效果,性价比奇高;


然后,简单知识问答系统核心就是RAG的使用,难点在于知识的处理,而后在Agent平台的使用,其实还在其次。因为其几乎只涉及一问一答,不用考虑什么意图识别,所以是比较简单的,如果将数据整理算作AI模块的话,AI含量是比较大的,可以算50%左右;


最后,就是多轮知识问答了,这个复杂度突然就被拉得很高,如果工作流难度是5,知识库难度是4,那么多轮知识问答的难度就是10!


前两类项目之前我们做了足够的介绍:


《工作流AI的方法论》


《AI客服的方法论》


今天重点说下多轮知识问答系统,这东西有点难,其难点有三:


  1. 第一,如何将认知(KnowHow)整理成知识,或者已经有知识的情况下,如何组织数据;


  2. 第二,数据应该如何与AI交互,保证每次AI都能拿到相关数据;


  3. 第三,也是最后一个关卡,意图识别;


关于第二点,如果发现由于数据不足导致的AI问题,应该如何用生产数据反馈系统优化知识库,这就是我们常说的数据飞轮系统,他是数据工程的一个分支,而AI项目的核心一直就是数据工程!


从整理数据到与AI交互再到后面的数据反馈,组成了我们常规的数据工程。


并且,很多知识是依赖于专业人员,如医生、律师、教师,这种非互联网工种根本无力整理自己的认知,于是需要互联网人组织他们,这里又涉及到了管理学,大家要相信,管理医生和律师去工作是很简单的,但要让他们做输出是很难的。


最后,数据工程是个漫长的周期,会导致AI项目的时间周期很长,并且系统一会表现得好、一会表现得差的,这会很消耗团队的士气,这里又涉及到了项目管理。


综上,复杂知识库项目其实是个偏工程的项目,特别是其中KnowHow、数据与技术架构、模型特性几者的纠缠会很复杂,如果不是本身水平很高的人,要么把这个事情理不清楚,要么没有管理能力去调动各个专业口的人员,但如果已经是高管的人,很难沉下心来一点点梳理KnowHow与数据,这可能是导致复杂AI应用很少的主要原因。


接下来是做这种复杂AI项目的一些心得:


AI项目十大心得


在做多轮知识问答项目时,有一些心得也同步分享给大家:


第一,知识库设计尤为关键,其中最难的是确定边界与结构,所谓边界是你的AI系统到底要完成什么任务,必须穷举定死;所谓结构,就是知识要能匹配这套系统;


第二,知识梳理的时候要考虑逻辑关系链、要设计实体结构,要找到切入知识库的核心,比如用一个不重样的关键词将知识实体搜索出来,再根据实体结构的逻辑链找到各种关系,只要逻辑链清晰,提示词就好设计,AI就会聪明很多;


第三,在做知识库实体结构时,类型不要太多,如果产生层级,层级也不能太多,因为关系越多工程实现越复杂、层级越多知识库处理越复杂。做AI应用要平衡真实世界的模拟与数据工程实现的ROI,也就是如果工程实现复杂度过高,就要在数据复杂度层面做取舍;


第四,在前三点的基础下需要考虑的是架构实现问题,这里必须由一号位自己写文档做产品甚至是架构设计,不用你写代码,但你文档写完需要相当于伪代码写完了,不然下面产品和技术没那个能力做出来的。这里的架构设计核心是你的知识,如何让AI每次都能拿到、拿对、拿全、不拿多;


第五,在知识齐全的情况下,如何让AI聊得像个人是个封闭性问题,他的前提是知识是对的,如何像人一样表达这段知识,需要考虑什么,需要建模,或者说需要设计策略;


这里心法就这么多,实际做起来就算是我也会有不停去解决各种麻烦事,所以大家可以结合信息再思考思考。


到这里,我们了解了复杂AI项目是什么,难点是什么,所以就可以回答最终的问题:复杂AI项目的团队应该如何设置?


unsetunsetAI团队设置unsetunset


从项目难度来说,多轮知识问答>>简单AI知识库>AI工作流,而且从上述的分层模型来说,他们会呈现向下兼容的特点,意思是能做好多轮知识问答系统就一定能轻松拿捏简单AI知识库。


所以,我们在做团队架构设计的时候就直接以最复杂的项目做安排,后续大家按情况做缩减即可,首先是核心三角关系:



首先技术Leader是一定要存在的,甚至在某些情况下他会兼任产品Leader;然后在复杂AI项目过程中一定会有行业专家,比如做AI医生团队里面一定会有医生、做AI律师团队里面也一定会有律师。


至于原因很简单,他们需要衡量AI产品的质量,这方面产研Leader几乎是毫无办法的。但一定要特别注意的是:


行业专家一定要汇报给产研Leader,因为这批人真的太难交流了,没有汇报关系他们会特别固执,不会按照我们的想法做推进


有了稳定的三角关系,就可以分配他们彼此的工作了,首先是最为重要的技术路径(技术架构、产品目的)。


每个AI产品一定会有其核心目标,以行业级AI应用如AI医生为例,我们在做设计的时候也不会期待有个大而全的东西解决所有,一定会对其进行分拆,比如做诊断的Agent、做慢病管理的Agent、做医保咨询的Agent...


再比如,我们在做教育类AI的时候,不会期待有个AI教师博古通今,在数学领域很屌,在英语这块也不错。所以在设计时候一定要进行分拆,甚至在具体品类还要一再分拆...


大AI产品的目标是一个,其次每个小Agent的目标也要很清晰,如果非要强制的将他们合并起来,就属于人为的增加技术难度了,难度过高的话,系统往往也就难以实现,这个时候最容易发生的事情就摆烂,全部交给LLM随意聊。


在这个基础之下,才能进入真正的核心工作,也是必须由三个角色共创的部分,输出核心技术路径,也就是设计出工程架构和数据结构


虽然现在很多AI项目出demo的周期很短(一般一周),但基本技术路径的设立不是一朝一夕的事,因为他需要很多轮的试错,如之前所述的多轮知识问答AI系统的难点:


  1. 数据结构是要找出当前业务在真实世界的映射,这个东西做出来会持续很长时间;


  2. 技术架构是要匹配这套数据结构工作,目标是在AI能够做到想我所想,言之有物,简单来说就是CoT和结果可溯源;



而在基本技术路径验证通过后,才是真正AI项目开始的时候,因为确认技术路径可能只需要50条数据,但要看到真实效果至少需要500条甚至更多,所以各条线工作就开始运转了:


首先最忙的是技术团队,他们要做AI项目工程实现的同时还要做各种效率工具,比如:


  1. 复杂的AI项目提示词很多(几十万行轻轻松松),所以需要一个提示词管理平台,后续需要做到多模型、多版本测试、切换、发布撒的;


  2. 知识库生产平台,用于协助行业专家录入知识库;


  3. 可观测性平台,如果是生产级应用,需要一个产品调试工具,他主要是给技术和业务专家看的,技术目标是调试,业务目标是看看各个环节有没有出错,这里粒度很细,会查看每个提示词、每个数据是不是有问题;


  4. ...


其次就是专家团队了,他们的工作相对单纯就是造数据和各种评价:


  1. 数据工程主力,配合技术团队不断挑战数据结构、不断采集数据;


  2. 产品测评主力,评价每次发布AI产品的实际效果,这里需要构建大量的测试数据集;


  3. 飞轮系统执行者,这里其实很简单,也就是配合技术团队不团补边界数据即可;


  4. 论文编写,如果需要知识产权撒的,需要产品技术辅助专家出论文;


  5. ...


最后是产品团队,他们的工作除了最本质的原型输出外,还包括:


  1. 竞品调研,他们要去调研各个竞品团队,并且需要专家团队优化测试数据集,让团队知道自己的产品和竞品真实的差距;


  2. 销售团队,所有的AI产品最终都会指向盈利,销售方案的输出一般是由产品团队着手;


  3. PR策略,PR和投放策略;


  4. ...


最后大概效果如图所示:



其实从这个图也可以看出Agent架构(类Manus产品)本身的问题所在,他们可能真的就没想真正的解决问题,比如行业Leader那条线他们是完全没有,或者说直接委托给了大模型自己处理,如果这样都能产出好的结果,那真的是奇了...


unsetunset结语unsetunset


最后,把目光拉回到OpenClaw,它确实火得一塌糊涂,也让人看到了精英小团队的爆发力。


一个极简的团队,一个极简的产品,一夜之间引爆全球讨论。这太符合这个时代对“奇迹”的想象了。


于是“一人公司”、“精英团队”、“去中心化”这些词汇被再次捧上神坛,成为无数创业者的兴奋剂。


但我想说的是:


OpenClaw的成功,恰恰不能证明这套方法论可以大规模复制。


为什么?因为OpenClaw本身是一个极特殊的样本。它是一个开源的、技术栈相对清晰的、不需要深度行业知识沉淀的底层工具类项目。它的爆发靠的是“技术优雅+时机卡位+社区情绪”,而不是靠一套复杂的组织哲学。


很难想象,一个AI医疗诊断系统、一个AI法律顾问、一个企业级知识库,能用同样的“赛马机制”和“一人成军”的逻辑做出来。


这些领域需要行业专家日复一日地梳理认知,需要技术团队搭建复杂的观测和调试平台,需要产品和销售去定义真正的市场价值。这不是几个天才关起门来赛马就能跑通的。


所以,未来还有很多像Manus、OpenClaw这样的爆款AI产品来点燃我们的想象力、来进一步推进AI项目的新范式落地。


但OpenEvidence、Harvey这种老牌AI明星才会持续耀眼!真正改变世界的AI公司,大概率还是得老老实实地啃硬骨头


精英团队的哲学很美,但它更像是“特种部队”的逻辑,他适合突袭、适合破局、适合在无人区插上一面旗帜。而当你要守住阵地、构建护城河、服务千万级用户时,你需要的是“正规军”的逻辑:分工、协同、流程、耐心,以及日复一日的数据工程。


不要用OpenClaw的成功,去否定那些看似“笨重”的组织形态。也不要因为在传统大厂里受过伤,就幻想“一人公司”是万能解药,


最好的组织架构,永远不是“最潮的”,而是“最匹配你当前要解决的那个难题”的


...


——谨以此文,致敬所有还在AI领域“啃硬骨头”的团队。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: