扫码打开虎嗅APP

No.2

2024-05-14

长期主义阅览室 长期主义Gravitism

一年过去,今天的Agent到底怎么样了?

主理人:
经过一周的研究,我对当前中文互联网上流行的几种Agent应用有了,有了以下浅见。

 

刘芮麟Ronin:

1️⃣ 去年兴起的Agent概念逐渐成为GenAI行业的核心趋势。 然而,遗憾的是,目前我(水平有限,希望向大家学习)尚未发现特别值得推荐的平台。

 

2️⃣ Agent生态目前正处于生态竞争的早期阶段。 绝大多数产品仍采用保守的策略。从过去的互联网产品生态发展经验来看,低学习曲线和高产品潜力是生态扩张的核心。

 

3️⃣ 主流的Agent应用要么提供基础的知识库部署,能力有限;要么通过大量投资快速扩张,难以持续;再或者过分沉浸在开发者视角中,忽视了用户的核心需求。 目前最具竞争力的GPT商店举措虽大,成效却微。其他Agent平台在定位与功能封装上也未形成明显的竞争优势。

 

为什么Agent产品雷声大雨点小?

 

在这里借用俞军老师的产品价值公式:

> 产品价值=(新体验-旧体验)-迁移成本

刘芮麟Ronin:

我的个人感受是,现阶段的Agent开发平台的体验价值并未高过迁移成本,这导致价值飞轮很难启动。

可以参考的典型行业是在AI浪潮出现之前的No-code/Low-code 开发浪潮,在这次浪潮中,低代码技术的指数级增长预期同用户的对数级增长形成了强烈反差。

 

🌟 通用技术并不一定会带来高速增长,技术成熟还需要规模效应来降低迁移成本,而技术普及率需要参考目标客户的【平均知识水平分布】

🌟 GPT作为一种通用技术和之前的低代码有本质上的区别,但回到产品级别和生态级别的竞争,如果LLM不能被封装的足够好,匹配【目标用户的一般知识水平】则难以完成所谓的“范式转移”革命。

 

Agent 平台想要完成生态化,需要解决的并非与同行比拼功能的更新速度,而是应该回到原点,去思考Agent出现以前人们都在用什么,这些过去的工具与产品的旧体验护城河仍旧非常深。

尤其在自动化、数据分析、知识抽取等领域,旧工具旧平台的平滑学习曲线与可预见的用例是一块硬骨头。


Agent 平台接下来会如何发展?

想要真正在有限的窗口时间内争取到Agent 生态中的核心地位,只有两条路走

刘芮麟Ronin:

1️⃣ 对不懂代码但懂产品的用户,提供封装完善的且能实现真正的复杂Multi-Agent 能力

2️⃣ 对熟悉技术但缺乏闭环视角的用户,提供尽可能便利的模型销售渠道以及更低成本的配套服务但目前的Agent 平台在打法上都比较中(平)庸,定位也较为模糊。

Agent能力的专业或通用,Agent源代码的开源或闭源或许都不是AI Agent 生态的版本答案。

技术用户觉得太玩具,非技术用户看不懂

PS:这里并未用专业与非专业来区分用户,因为许多Agent 的开发需求并非和技术积累挂钩,而是和行业积累挂钩,只有行业资深用户才有迫切的、刚性的开发和付费需求,这一点我认为是需要明确的。

 

刘芮麟Ronin:

也许是来自于KPI的压力而选择的折中方案。但这种折中方案会错失正在成长起来的零基础用户,这批在GPT 元年加入的用户许多都来自非ML、CV、NLP行业,对于技术与Ai都不甚了解,但是他们在各自原有的领域中都积累的大量的know-how,这是一笔宝贵的财富,对于Agent 平台而言,也是一个被忽视的富矿。

 

下面是我对目前Agent 平台的一些简单回顾(挂一漏万)

1️⃣ Dify 我最早接触的LLM应用开发平台,一开始的定位是LLMOps产品,后续逐渐更新了诸多功能并慢慢发展为了类AI应用开发框架,优点是代码开源,文档全面,更新速度快(几乎每周都会update)缺点可能就是人少钱少吧,我个人对Dify还是挺有好感的,希望他们能顺利成长起来。

2️⃣ Coze 字节出品分为海外和国服两个版本,重要的是插件非常多,可视化做的好,且可以免费用GPT4以及各种付费API,缺点是产品定位的不清晰,导致对插件功能的过度阉割以及复杂工作流最佳实践案例文档的缺失(Coze 的上限相对较高,入手难度相对较低,但是在涉及到复杂Agent和Multi-agent 的制作时,学习成本和曲线陡峭,希望后续更新能够弥补)PS:今晚国服刚更新了图工作流模式,效果不错值得一试。

3️⃣ GPTs ChatGPT的内嵌应用,优点是原生LLM,全球海量用户,资金多团队强,缺点是明星项目太多了,很难做到雨露均沾,作为类App Store 的GPT商店一直不温不火。

4️⃣ Langchian 最早的Agent框架之一,虽然在今天看来存在诸多不足,但是链、代理、工具、内存这些概念都被后来者很好的继承扬弃,并且还在不断更新,时候初学者试着跑一跑,感受一下“初代”。

5️⃣ FastGPT 更加专注问答系统,提供了许多主流RAG技术支持,在QA(问答)场景尤其是相对复杂的QA场景有一定优势,

6️⃣ metaGPT 定向领域的多角色模拟Agent,在去年刚出来的时候是非常亮眼的,但那个时候的我完全不具备代码能力甚至代码思维,Code = SOP(Team) 是他的核心哲学,提出了很有意思的视角,“传统组织的核心资产是SOP,互联网企业的核心资产是Code”,对于特定领域的AI编程需求比较有用。