扫码打开虎嗅APP
在今天回顾过去一年AI应用层的进展,AI搜索一定是难以忽视的一个方向。在很长的一段时间里,AI搜索=Perplexity,在榜单上,几乎感受不到其他搜索产品的存在。但市场,似乎在释放新的信号。本文来自微信公众号:白鲸出海 (ID:baijingapp),作者:张凯然、李爽,编辑:殷观晓,原文标题:《半年12.8亿美金,以为没什么机会的赛道,疯狂融资》,头图来自:视觉中国
一、搜索,依然极具想象力,资本用脚投票
一方面,信息检索是能与当前大模型能力匹配的一大应用场景;另一方面,AI搜索明星产品Perplexity流量仍在稳步增长,体现出用户端对搜索体验升级的新需求。即使AI搜索也存在种种问题,例如PMF的验证、尚难以撼动传统搜索引擎等等,且依旧被创业者视作“LLM初期最有可能跑出Killer APP的领域”,很被资本看好。
Perplexity最新估值30亿美金,基本属于估值第一梯队的纯AI应用(不做模型)公司。它仅在今年上半年就完成了两次融资,两轮融资总额超过7000万美元。但是大家聚焦Perplexity这一“资本宠儿”的上半年,资本还默默投出去了12.1亿美金。
上半年15起AI搜索融资,不同应用场景项目占比
上半年,我们根据公开信息统计了共计15起AI搜索领域的投融资,我们发现:
1. 面向企业\行业场景的AI搜索企业获投最多,前者也是最容易获得单笔大额融资的AI搜索落地场景;
2. 另一热门落地场景是电商+AI搜索,在获投项目中,其与通用搜索的占比均为20%;
3. 播客搜索等相对“小众”的场景下也出现了融资案例。
上半年15起AI搜索融资信息统计
这些资本青睐的AI搜索产品到底都长啥样?
二、音视频搜索
Dexa:搜索播客知识点,向“专家”提问
总部所在地:美国纽约
创始人:Riley Tomasek
成立时间:2023年
最后一轮融资信息:2024年2月,Abstract Ventures、The General Partnership领投600万美元种子轮融资,融资后估值未知。
如果你经常听播客,大概率都曾遇到过一个问题,某天心血来潮想起之前在播客中听到的一个精彩洞见,想要回听,却怎么都记不起它是来自哪一位主播,哪一个单集。即使幸运地锁定单集,又在时间戳的帮助下将范围缩小到20分钟的片段,也只能选择自行听完或者转录成文字后查找,非常费时。Dexa的创始人Riley Tomasek也曾有过类似困扰,一次耗时的查找之后,他决定打造一款面向播客场景的AI搜索工具。
Dexa没有详细阐释过产品的技术路线,但表示自己使用了先进的索引技术,将基于主播、单集和节目三个维度的知识图谱提供准确和高效的搜索服务,它的核心数据源来自120多档播客节目,并且仍在持续地添加中,包括知名的《Tim Ferriss Show》《Huberman Lab》等等。产品设计中,Dexa的一大核心理念是“向专家提问”(如图所示),搜索时用户可以选择向特定的主播提问(或者不限定主播),健康、商业、科技、个人成长等领域的问题都是大热门。
搜索结果以AI总结的形式呈现,并附上对应播客谈及该问题的具体时间戳,点击即可收听。搜索结果也支持用户一键分享,一部分内容有机会直接出现在Google的搜索结果中,从而带来网站的自然流量。但Similarweb数据显示,今年6月Dexa的网站月访问量大概在29万次左右,相较今年2月100万月访问的水平大幅度下滑。
白鲸评论:产品好、场景小众。查找听过的播客实在不是一个太高频的应用场景,Dexa目前的数据库体量也限制了它向其他应用场景拓展。截至今年2月,Dexa尚未开始产生收入,TechCrunch就播客AI搜索的创业方向与一些播客转录、数据库产品的创业团队交流过,他们表示AI搜索的成本问题是一大考量因素。
Twelve Labs:生成视频难,不如先“理解”视频
总部所在地:美国旧金山
创始人:Jae Lee
创立时间:2021年
最后一路融资信息:2024年6月1日,New Enterprise Associates(NEA)和NVIDIA's NVentures领投5000万美元A轮融资,融资后估值2~3亿美元。
Twelve Labs是一家致力于打造多模态“视频理解”(Video Understanding)基础设施,以实现对视频进行语义搜索的AI公司。
技术特点:根据官网介绍,借助于旗下的Marengo模型,Twelve Labs可以实现快速对大量视频内容进行索引(即转换成可以被快速检索和访问的形式),让用户能够通过自然语言来搜索和访问存储在视频中的各种信息。
Twelve Labs认为视频最为接近人们体验的“现实”,而大语言模型在视频领域的能力有限。而其打造的多模态大模型Marengo-2.6最快能在15分钟内索引1个小时的视频,并实现文本到视频、文本到音频以及图片到视频的搜索任务。
应用场景:目前Twelve Labs已与媒体和娱乐、广告、自动化及安全等多领域的客户展开合作,例如借助AI视频搜索实现快速标记赛事精彩瞬间、查找监控录像等。
在AI视频搜索之外,Twelve Labs最新大模型Pegasus能够实现视频到文本的转换,目前正在Beta测试中。Pegasus能够进一步理解复杂视频,具备总结、查询、回答及分析能力。据悉Twelve Labs在训练基础模型时,会同时训练模型的多个部分,使得模型的整体大小只有原来的1\5,也提高了计算效率和能源效率。
三、电商搜索
DayDream:强大的创始团队,能搞定一个新入口需要的流量吗?
总部所在地:美国
创始人:Julie Bornstein
创立时间:2023年
最后一轮融资金额:2024年6月20日,Forerunner Ventures和Index Ventures共同领投5000万美元种子轮融资。
购物或许是快乐的,但是购买决策常让一些消费者感觉“筋疲力尽”,为解决上述问题,一批电商场景的AI搜索产品应运而生,DayDream就是其中之一。
它支持用户使用自然语言或者图像识别进行搜索,使用时,用户只用说明使用场景就能找到心仪产品。比如提问“这个夏天我要去海边参加婚礼,请给我一些着装建议”;再比如,用户可以上传一张蓝色裙子的照片,并提问,“我很喜欢这条裙子的款式,但是我想要一条红色的。”改进的重点在于使得整个交互体验更加个性化,推荐更具针对性。
为实现上述搜索体验,DayDream选择将现成大模型微调,并创建了一个包含众多产品类目的数据集。它计划于今年秋天在美国开启Beta测试,上线之初DayDream将专注在时尚领域,合作对象包括Net-A-Porter,Altuzarra,Jimmy Choo,Doen,Alo Yoga and La DoubleJ.在内的2000余个时尚品牌。
白鲸评论:今年上半年,电商领域的AI搜索融资不少,但是像DayDream直接打造ToC产品却不多,主要是因为竞争相当激烈。像亚马逊、Google以及TikTok等巨头都在自研用AI优化购物体验,体量小一点的电商平台也在尝试接入外部解决方案来集成AI搜索(下文还会提及)。这一波趋势里,一个全新的商品发现入口需要的流量成本估计高得惊人。目前看起来,DayDream受资本认可的一大原因是团队背景很强。
DayDream的创始人Bornstein此前创立的AI购物初创公司The Yes被Pinterest成功收购,其CPO和CTO分别来自Google的人工智能研究小组和微软的数据和应用科学团队,CCO和CSO也分别曾在Google的时尚商务拓展部门和Pinterest的购物策略团队任职。从技术到市场,都有人在。
Constructor:“十年老兵”的思考,AI搜索落点在转化
总部所在地:美国旧金山
创始人:Eli Finkelshteyn和Dan McCormick
创立时间:2015年
最后一轮融资信息:2024年6月17日,完成由Sapphire Ventures领投的2500万美元B轮融资,融资后估值未知。
应用场景:Constructor是一家成立近10年的电商服务商,专注于为电商客户提供产品发现相关的配套服务,涵盖从搜索到浏览、推荐、收藏、商家智能(数据分析)、用户测试、AI购物助手(ASA)在内的各个方面。其最新推出的ASA解决方案与DayDream提供相似功能,即当购物网站选择集成后,用户可以通过自然语言交互的方式获得个性化的商品推荐,而商家通过消费体验的改善提升客户满意度和销售额。
技术特点:ASA的原理是通过用户的点击行为数据、Transformers模型和大语言模型来快速识别用户的搜索意图。而除了优化搜索体验之外,Constructor也会向商家提供配套的数据分析功能来提升转化率。截至今年上半年,Constructor已为超过1000亿次客户互动提供支持,该公司的客户量在过去一年中增加了50%,并且在过去三年中保持了98.5%的平均客户留存率,丝芙兰、Target在内的知名电商平台都是其客户。
Remark:真人工·智能
总部所在地:未知
创始人:Theo Satloff
创立时间:未知
最后一轮融资信息:今年5月,从Spero Ventures、Stripe、Shine Capital、Neo、Sugar Capital等共计12名投资者中获得1030万美元种子轮融资。
同样是帮助用户进行购物决策,如果说DayDream、Constructor专注于搜索环节的优化,Remark则尝试建立另外一种匹配机制,它引入真人专家,想给予用户VIP般的购物体验。
技术特点与数据来源:Remark引入的真人专家包括艺术家、音乐家、造型师、高尔夫球手以及滑雪教练等,它将服务集成在品牌的独立站中,用户可以随时向真人专家寻求购物建议。而如今Remark开始用50000名专家的数据训练AI,当专家离线时,AI也能提供服务,并且成交后会抽取一部分佣金给到专家。
应用场景:一个典型的应用场景是,当进入一个滑雪户外产品独立站时,新手用户可能会对区分滑雪板的型号、尺寸和适用场景等无从下手,它通过Remark的专家匹配服务获得极具针对性和专业的购买建议。Remark目前主要与户外用品、婴儿用品、美容护肤品等行业的客户合作,其公布的数据显示集成相关服务后客户的收入增长了9%,转化率提高了30%。
白鲸评论:相较于用AI取代人工客服的“大趋势”,Remark积极引入专家导购可谓是出了一个奇招,并且即使加入了AI也是异常克制的、仅起到辅助专家的作用。印象颇为深刻的是,Remark团队其实非常强调消费者在购物中的情感体验,而他们认为正是人的加入让这一体验得以完整,这也是过去在线电商所忽视的部分。
某种程度上,你可以认为Remark打造的购物决策流程是希望兼顾理性和感性的,足够理想化,但其涉及到相当高的沟通成本,或许只会在高客单价、有认知门槛的品类中有生存空间。
四、通用搜索
Adot:web3与AI搜索
总部所在地:美国加州
创始人:Dr.Wei Z(华裔)
创立时间:2022年
最后一轮融资:2024年4月25日完成300万美金种子轮美金,由Hash Global领投,融资后估值未透露。
技术特点:Adot是一款采取去中心化架构的搜索引擎,不依赖中心服务器,把数据存储在多个节点中。此外,Adot还引入了激励机制,使用搜索引擎或者参与数据收集、索引、分析、整理的用户,都可以获得虚拟货币奖励。
应用场景:Adot是一个通用搜索引擎,但大多数用户会通过Adot获取对于加密货币市场的洞察和与Web3相关的知识和新闻。
数据来源:Adot融合了Web2和Web3的数据,除了传统网页外,它还包含区块链数据、社交媒体数据、Web3交易数据等。
Genspark:“小红书版”AI搜索引擎
创始人:景鲲,前小度CEO;朱凯华,前小度CTO
创立时间:2023年
总部所在地:美国加州、新加坡
最后一轮融资信息:6月18日,完成由蓝驰创投领投的6000万美元融资,投后估值为2.6亿美元。
2023年,Bing在全球搜索引擎中的市占率虽然不到4%,但是其全年收入却达到了120亿美元。换句话说,AI搜索即使仅从传统搜索引擎中抢到1%的市场份额,也是相当大的一块蛋糕。这句话是Perplexity创始人对自己的“安慰”,也同样适用于Genspark。
Genspark将自己定位为一个AI Agent引擎,面对各类问题,有专门AI Agent进行执行研究并产出名为Sparkpages的自定义页面。这一页面的输出原则是,摒弃所有的偏见和SEO驱动的内容,综合可信信息,提供有价值的结果和节省用户时间。具体来说,Genspark目前主攻旅行、商品两大垂类方向的内容搜索业务,Sparkpages作为AI Agent生成的优质网页承接最终搜索结果。
例如当用户输入“北京三日游出行建议”的问询,将跳转自Sparkpages页面,它将以类似小红书图文信息流的形式呈现多个结果,用户可以点击感兴趣的结果查看详细信息和进行进一步问询,这种图文结合的内容组织形式其实也比较匹配Genspark目前切入的旅行和商品的品类,体现差异化的同时也能够迅速占领用户心智。
五、向量搜索
Qdrant
总部所在地:德国柏林
创始人:Andre Zayarni
创立时间:2021年
最后一轮融资:2024年1月23日完成2800万美金A轮融资,由Spark Capital领投,融资后估值未公布。
技术特点:Qdrant是一个开源向量数据库和向量相似性搜索引擎,用Rust语言编写。互联网上的文字、图片、音视频等模态的数据都可以转换为向量,并在向量数据库存储,这种存储方式的好处是,可以用更少的空间存储数量更庞大的数据,并可以更方便地对数据进行快速检索和高效管理。
而向量相似性搜索引擎中的向量,可以看作传统搜索引擎中的关键词和网站链接。通过向量搜索引擎,用户可以快速找到数据库中与输入向量相似的向量,然后再将向量转换为相应的文字、图像、音视频等信息来使用。
应用场景:向量数据库及搜索引擎是一个重要的基础设施,主要通过API和客户端库供开发者使用,它广泛地应用于个性化推荐、文本/图像的处理与识别、实时数据分析与监测等领域,用来快速查找向量数据库中相似的向量,并转换为常规数据进行使用或分析。
数据来源:向量数据库中的数据来自公开数据集、网络爬虫、第三方数据服务商等渠道的文字、图片、视频、音频等模态的向量数据。
Marqo
总部所在地:美国加州
创始人:Tim Harmer
创立时间:2021年
最后一轮融资:2024年2月15日完成1250万美金A轮融资,由Lightspeed领投,融资后估值未公布。
技术特点:Marqo提供的功能与Qdrant类似,但Marqo使用更大众化的Python语言编写,可以无缝集成Python机器学习项目和数据库,更适合中小开发者使用,在Python开发者社区中也非常受欢迎。但是Marqo在处理高并发需求、大规模数据等复杂业务场景的性能不如Qdrant。
应用场景:Marqo更适合Python项目或中小开发者相对简单的项目,而Qdrant更适合需要处理大量数据和高并发请求的大企业使用。
数据来源:与Qdrant相同。
六、企业/行业场景搜索
Glean:估值已经22亿美金的打工人搜索引擎
总部所在地:美国加州
创始人:Arvind Jain
创立时间:2019年
最后一轮融资:2024年2月27日完成2亿美金D轮融资,由Adams Street领投,融资后估值为22亿美金。
技术特点:Glean是一款以搜索为核心的工作助手。它可以在公司内部各数据源中(包括Outlook、Office、Google Workspace、Salesforce等)进行交叉搜索,给出用户需要的文件、数据,或直接就问题给出答案。AI会针对搜索者的职位和搜索习惯优化呈现的结果,即使搜索相同的关键词,同公司不同岗位的员工,也会获得不同的结果。
除了传统模式的搜索引擎之外,用户还可以在AI Chat功能中直接询问AI或者用自然语言进行搜索,AI在给出答案的同时,还会给出该内容出自哪个文档。此外,用户还可以在所有的文档中看到与这个文档有关的同事(比如作者、审批者等),方便公司进行信息的管理和协作。
除了搜索功能外,Glean还提供AI生成文字内容、管理日程安排、预定会议、快速访问常用文档和应用等便捷功能。据媒体报道,Glean使用了包括GPT在内的多款大语言模型。
应用场景:Glean并没有特别针对的行业,算是一款工作场景通用的效率工具。
数据来源:互联网公开信息、企业内部数据。
Hebbia:金融行业起步,ARR已过千万美金
总部所在地:美国纽约
创始人:George Sivulka
创立时间:2020年
最后一轮融资:2024年7月9日完成1.3亿美金B轮融资,由a16z领投,融资后估值为7亿美金。
技术特点:Hebbia的核心产品名为Matrix,是一款主打专业化数据处理的AI工具。它可以从多个形式不同的文件中检索和提取多种数据,交叉核对后,在文档或表格中输出用户需要的数据。用户可以自定义任务内容,也可以将本次任务保存为模板,以便在日后的工作中使用。同时,在AI执行任务的过程中,用户可以监控AI每一步检索和校对的过程,了解这些数据的出处。
用户还可以基于Matrix接入的所有数据源,询问AI相关问题,比如,让AI直接给出所有目标公司中年增长率超过5倍的公司名单。
应用场景:Hebbia目前专注于金融行业,它使用的AI模型也针对金融行业进行了特别训练,用于市场研究、证劵、投资、审计等多个细分场景。目前Hebbia的ARR(年度经常性收入)已经达到了1300万美金,其7亿美金的估值约为ARR的54倍。
在拿到融资后,Hebbia开始把应用场景扩展到法律、咨询、政府、军工、制造业、制药等多个行业中。
数据来源:公开信息、企业内部数据库、第三方数据库。
Alphasense:已经快上市的金融行业专用搜索引擎
总部所在地:美国纽约
创始人:Jack Kokko
创立时间:2023年
最后一轮融资:2024年6月11日完成6.5亿美金D轮融资,Viking Global Investors和BDT&MSD Partners共同牵头,Google参与,融资后估值为40亿美金。
技术特点:AlphaSense又是一款专为企业和金融专业人士设计的搜索引擎,它整合了网络上关于金融市场的公开信息和一些内部信息,用户可以通过关键词搜索或与AI对话来搜寻信息。AI在给出信息和行业观点后还会提供根据,以便用户进行交叉验证。
AlphaSense自行研发了适应金融领域的大模型AlphaSense Large Language Model,这款模型可以理解复杂的金融术语和市场动态,基于大模型能力,AlphaSense可以从大量文件中提取相关信息,进行分析,并输出行业观点。
根据高盛的数据,AlphaSense的ARR高达2亿美金,目前正在准备上市。
应用场景:AlphaSense的主要用户群体有金融分析师、企业战略决策者、市场研究人员等,用来快速搜索市场数据,辅助他们做出分析与决策。
数据来源:公司文件、公开的财务数据、市场研究报告、专家分析、新闻报道、企业内部报告等。
CuspAI:材料专用Search Engine
总部所在地:英国剑桥
创始人:Max Welling教授和Chad Edwards博士
创立时间:2023年
最后一轮融资:2024年6月18日完成3000万美金种子轮融资,由Hoxton Ventures领投,融资后估值未公布。
技术特点:CuspAI是一个材料学“搜索引擎”,用户输入用户理想中材料所需具备的特点与属性,AI就会依据掌握的知识快速筛选不同的分子结构,给出一个或是几个可行的材料分子结构,供研究人员进一步研究。
应用场景:CuspAI主要应用于各种科研场景。最近,团队正在用CuspAI设计一种可供捕获和存储碳的材料,它可以吸收空气中的二氧化碳,并存储下来。
数据来源:专业数据库。
EXA:“针对”SEO,准确的链接优先于关键词
总部所在地:美国加州
创始人:Will Bryk和Jeff Wang(华裔)
创立时间:2021年
最后一轮融资:2024年7月16日完成1700万美金A轮融资,由Lightspeed领投,融资后估值未公布。
技术特点:EXA是一款适应人工智能时代的搜索引擎,可以在复杂搜索场景下,满足Google和Bing无法满足的搜索需求。
与Google最大的不同是,EXA的AI模型使用了Transformer架构,搜索引擎可以直接理解用户的语义,并直接给出与语义最相关的链接,而不是靠关键词进行搜索,再让AI基于关键词搜索的结果进行整合。
这样的模式能使获得的结果更加精准,也能够排除SEO的影响,尤其适合复杂场景下的搜索。
应用场景:EXA的使用场景主要是面向B端的,虽然C端用户也可以在网站端使用,但绝大多数用户是通过API调用,使用EXA的服务的。
比如AI写作助手可以调用EXA的API直接查找与用户具有相似想法的论文或者Blog,并将答案整合进输出中,提高内容的质量。EXA还可以应用在企业市场调研、金融、法律等对信息质量要求较高,任务也相对复杂的搜索场景。
数据来源:互联网公开数据。
七、写在最后
查找投融资信息时,我们也尝试查找国内AI搜索产品的投融资线索,结果发现,国内公司做AI的思路基本上都是将搜索功能整合进“大而全”的AI产品中,很难将其定义为单纯的AI搜索产品,比如虽然大模型公司月之暗面在5月22日进行了一笔融资,但我们很难将其归于AI搜索领域的投融资。
而除了很难界定的产品外,我们并没有找到做AI搜索且在上半年获得融资的产品。这个原因可能是,目前市场上用户数量较多的AI产品,比如字节的豆包、百度的文新一言、昆仑万维的天工等产品都包含了AI搜索功能,其他小公司靠做AI搜索似乎确实比较难拿到融资。