扫码打开虎嗅APP
本文来自微信公众号:我思锅我在 (ID:angelplusdevil),编译:我思锅我在GN,原文标题:《14 张图表还原当前的 AI 地图和资本之争 | AIGC 101》,题图来自:视觉中国
Newcomer是我一直订阅的付费专栏,作者Eric曾是科技新闻网站The Information的第一位员工,后来为彭博社(Bloomberg)写了六年关于技术行业的文章。在那段时间里,他大部分时间都在报道创业公司的来龙去脉,还有公司首次IPO、整合并购的新闻。
这篇文章里,他跟数据科学家邵文琪(Wenqi Shao)一起整理了截至5月底,生成式AI市场最新的创业地图与资本之争,以及大模型表现、开源关注度等方面排名。
在用GPT整理翻译同时,文中也添加了我对一些关键图表和发现和理解,结尾也表达了对当下Generative AI的浅薄看法。
目前 AI 领域发生了很多事情。
OpenAI和Anthropic之间正在进行竞赛。
开源项目正在努力展示它们的相关性。
大量资金正在涌入这个领域。
我们已经看到一些项目一度声名鹊起,但一个月后又跌回地面。
我们想要通过数据来理解正在发生的一切。我们希望回答一些问题,例如,独立测试中模型的表现如何?哪些项目在GitHub上积累了最大的代码库?以及哪些类型的AI初创公司获得了最多的资金?
在Webflow的首席数据科学家、曾在Facebook、Uber和Flexport工作的数据科学家邵文琪的帮助下,我们编制了14张图表,提供了AI领域正在发生的真实情况的思考图景。
以下与资金有关的图表是基于NFX的生成技术开源市场地图[1]构建的,并结合了Base 10的生成式 AI 仪表板、公司网站和PitchBook的其他数据。这个数据集涵盖了440多个获得融资的生成式AI初创公司,共筹集了超过260亿美元。其他图表的数据来源包括LMSYS Org、data.ai、GitHub、AngelList、Domain Name Stat和个别AI公司的网站。
OpenAI、Anthropic和开源项目Vacuna在大语言模型中处于领先地位
Chatbot Arena[2]是一个基于大众参与的大型语言模型(LLM)基准平台,通过匿名、随机的语言模型对决来进行评估。经过超过27000次对决,OpenAI的GPT-4获得了第一名。
与此同时,由OpenAI的离职员工创立的初创公司Anthropic凭借其LLM版本Claude分别获得了第二名和第三名。但最令人惊讶的排名出现在第五名的Vicuna-13B上。Vicuna是一个开源语言模型,由多所大学合作于三月份推出,它是基于Stable Diffusion进行开发的。Vicuna和其他开源模型的表现给人们带来了希望,即私人公司可能无法独占这场技术竞赛。
Anthropic和Mosaic提供的记忆容量是OpenAI的两倍以上
如果你曾经试图与ChatGPT进行一次持续的对话,那么你就会知道当它开始忘记你之前的对话内容时是多么令人失望。这是因为OpenAI只为付费用户的GPT-4提供了区区8000个token的记忆容量。
这一刻曾经是诱人的,但竞争对手Anthropic提供了十万个token,大约相当于75000个单词的容量。(作为参考,马克·吐温的《汤姆·索亚历险记》有69000个单词。)
AI GitHub明星榜将Auto-GPT排在首位
GitHub上的榜单让我们了解AI开发者项目的受欢迎程度,下面的图表显示了平台上一些最受关注的AI项目库。
到目前为止,最受欢迎的存储库是Auto-GPT,它是一个开源尝试,旨在使GPT-4完全自主。
其他一些非常活跃的存储库包括用于流行项目(如Stable Diffusion)的协作Web用户界面,以及在本地计算机上运行Facebook开源项目LLaMa的方法,以及用于GPT-4/GPT-3.5驱动的聊天的桌面应用程序。
此外,还有一些旨在简化AI开发的技术,如LangChain(通过可组合性实现使用LLM构建应用程序)、Open-Assistant(基于聊天的助手)、ColossalAI(专注于分布式技术,使运行大型AI模型更便宜、更快)以及像Bark和SoftVC VITS这样的生成式音频模型。
AI应用Lensa衰落,而类Chatbot应用在4月份达到顶峰
大众市场对生成式AI的兴趣最初是在2022年11月出现的照片AI应用程序(如Lensa)中。
尽管我们在12月份看到了一系列快速的活动,并涌现出许多类似的照片头像应用程序,但消费者的兴趣很快就下降了,后来转移到了类似于聊天机器人的LLM应用程序上。
根据Data.ai(前身为App Annie)的应用程序分析下载数据,我们观察到Lensa在美国的每周下载量达到了200万次的高峰。
然而,最近Lensa的每周下载量已降至约2万次。
从3月份开始,消费者的兴趣开始转向聊天机器人,在ChatGPT API推出后,聊天机器人的发展势头迅猛。
虽然类Chatbot应用(包括Nova AI、Genie AI、Ask AI和AI Chat)在4月份达到了顶峰,但聊天机器人表现更为强劲。自从这一类别在3月底爆发以来,这个组合几乎每周都获得超过100万次的下载量。
自2023年3月以来,排名前四的聊天机器人总共累积了1000万次的下载量,超过了Lensa下载量的两倍。
在消费者AI应用程序领域,还值得注意的是,OpenAI最近宣布推出了他们的官方iOS移动应用程序,该应用程序在发布后立即登上了App Store榜首。
“.ai”域名的需求去年底达到巅峰
如果这个系列中有一个图表能够对“AI hype”发出警告的话,那就是这个:公司们在去年12月疯狂收购了“.ai”域名,然后在域名争夺战上从12月后放缓了脚步。
新的 AI 公司炒作周期是开始还是结束?域名注册在2022年12月达到了顶峰,今年虽然渐渐消退,但仍保持在较高的水平,平均每周超过1500个注册量。
AI初创公司追逐市场营销、音频和客户支持领域的机遇
在 AI 的炒作中,VC 冒着资助大量竞争性初创公司的风险。我们研究了生成式 AI 领域中竞争最激烈的行业。
根据初创公司数量来看,最受欢迎的领域是市场营销和销售的文本应用。第二受欢迎的是音频应用,第三是客户支持和聊天机器人应用。图像应用排名第四。
这是按照融资公司数量的排名,而按照融资金额会有很大不同,这与该领域内比如大模型初期所需要的启动资金直接相关,而融资金额一定程度上反映了创业的进入门槛,详细情况见下一张图。
然而大额资金纷纷投入到机器学习和MLOps领域
在总计150亿美元的 AI 融资中(不包括OpenAI),获得最多资金的类别是MLOps(包含LLMOps)和平台工具。
按筹集的中位数金额对各个类别进行排序后,除了机器学习运营/平台之外,筹款最多的初创公司来自:
语义和向量搜索(Semantic & Vector search)类别以Pinecone为代表的公司。
其次是法律、生物学、客户支持和聊天机器人、以及合成数据生成类别的初创公司。
至少有36家生成式AI公司筹集了超过1亿美元的资金
虽然投资者争相寻找进入AI领域的机会,但大部分生成式AI公司已经获得了巨额融资。
目前,大约80%的生成式 AI 公司已经筹集了超过100万美元的资金,近50%的公司筹集了超过500万美元,接近三分之一的公司已经获得超过2500万美元融资。
绝大多数生成式AI公司认为自己处于种子阶段
但是,我们仍然处于非常早期阶段,超过三分之二的公司目前处于A轮或更早的阶段。
只有少数几家生成式AI公司,其中许多是在这个新领域中的知名公司,如Runway、Anthropic和Scale AI,已经达到了我们所说的“后期阶段”的融资。
在我看来,其实Runway、Rewind等“AI Native”的公司即便从估值和融资速度上绝对领先,但产品和业务表现上依旧在探索PMF的早期。
生成式AI公司并非一夜之间取得成功
尽管现在是创办AI公司的热门时刻,但现在被视为生成式AI公司的知名公司实际上是十年前创立的,并且随着生成式AI技术的发展逐渐取得了成功。
例如,Facetune的开发者Lightricks成立于2013年;专门从事代码补全的Tabnine成立于2012年;而AI个人聊天机器人Replika则始于2013年。
2017年,我们见证了像Woebot Health这样的心理健康聊天机器人公司的出现,以及像Cresta这样的AI智能客服和Weights & Biases这样的深度学习训练平台等公司,它们随后在近年来获得了重要的资金支持。
事实上,迄今为止,超过75%的生成式AI初创公司筹集的总资金来自于2019年或之前成立的公司。(我们在资金图表中不包括OpenAI,因为其与微软的交易被报道为总计100亿美元,这会扭曲数字。)
湾区初创公司获得了超过一半的生成式AI融资
全球对生成式AI的兴趣非常大,近一半的公司来自美国以外的国家。
大约四分之一的这些公司位于欧洲、英国和荷兰,而9%的公司位于印度和亚洲。
然而,旧金山湾区的公司获得了大部分的融资,而美国作为一个整体占据了总融资的约74%。这甚至还不包括OpenAI在内。
我们在旧金山举办Cerebral Valley AI峰会也有其原因。
现有公司感受到前所未有的压力,纷纷加快推出生成式AI解决方案
Source: 公司公告整理
除了谷歌、微软和Meta,还有30多家领先的公司宣布将内置生成式AI解决方案。其中大多数尚未投入生产使用。
Canva、Notion和Retool等无代码工具公司已将生成式AI功能整合到其核心产品中。像Intercom这样的客户支持公司正在大力投入AI聊天机器人解决方案,而Slack也将很快推出SlackGPT。Brex和Ramp等支付公司正在推出智能解决方案,用于识别节省机会。甚至像Box和Airtable这样的数据库公司也宣布了用于部署AI和简化工作流程的功能。
知名个人天使投资人Elad Gil也在播客里预测,未来12到18个月我们会看到越来越多的现有软件公司推出真正意义上集成AI的产品。而最近最让人惊艳的公司则是Adobe,在Photoshop中集成Firefly后的效果受到许多用户的好评。
早期的AI和机器学习交易在第二季度出现激增
Web3再见,AI你好。
2022年第二季度,早期的Web3投资占据了AngelList上早期交易活动的10%以上。现在,Web3只占到了5%。
Source: AngelList
与此同时,AI/机器学习的比例已经上升到13%。而且这个趋势并没有显示出任何迅速回落的迹象。
写在最后
最近发现无论硅谷投资人还是创业公司,都把更多目光投向了生成式AI在企业级(Enterprise)的应用,其中有个观点我很认同,企业级应用相对于通用型工具来说,似乎更“容易”分析壁垒这件事。
但是,这个壁垒是初创公司的还是现有公司的,是一个很严肃的问题。我认为如果企业因为需要大模型部署而需要或产生“新数据”,那么这可能是初创公司的机会。
进一步说,如果是“需要”新数据,初创公司需要花更多时间与企业客户探讨现在的业务模式和遇到的问题,如何通过大模型来处理原先方案所不能解决的痛点,这正是Stability.ai、Cohere等大模型初创公司在做的事情,这与开源或闭源没有关系。
如果是“产生”新数据,那这时候初创公司就很可能也要跟大公司竞争,这里的大公司不仅是像OpenAI、微软这类巨头,更多是在垂直行业的SaaS公司,包括法律、金融、设计等领域,他们很可能已经掌握了从业者在工作流中产生的数据。
但有意思的是,最近发现许多在垂直领域内的通用机会比如简单的会议纪要,大部分从业者仍在用非常通用的工具却完全无法达到提升效率的目的。这往往是很多大公司或垂直SaaS还看不上的机会,我已经看到一些初创公司在行动了。
原文地址:https://www.newcomer.co/p/14-charts-that-tell-the-story-of
参考资料
[1]开源项目:https://www.nfx.com/post/generative-ai-tech-market-map