扫码打开虎嗅APP
本文来自微信公众号:乌鸦智能说(ID:wuyazhinengshuo),作者:小黑,原文标题:《攻入谷歌腹地!OpenAI搜索要来了,或将于5月9日发布》,题图来自:视觉中国
据多家外媒近日报道,知情人士透露称,OpenAI正秘密研发一款新的搜索引擎,可能叫SearchGPT或Sonic,目标是挑战Google的搜索霸权。
“OpenAI即将向谷歌搜索发起挑战,这是谷歌迄今为止面临的最严重威胁。”前 Mila 研究员、麻省理工讲师Lior S在X平台上爆料称。
据X用户名为Jimmy Apples的人工智能领域的知名爆料者预测,OpenAI将在5月9日发布新产品。而值得注意的是,谷歌I/O开发者大会将于5月14日召开。也就是说,OpenAI将抢在这场盛会之前发布搜索产品,大有“先发制人”之意。
有趣的是,当OpenAI搜索即将上线消息传出,谷歌的股价没有丝毫变化。这与一年前ChatGPT横空出世,众人大呼敲响搜索的丧钟形成了天壤之别。
为什么OpenAI会盯上谷歌这块“蛋糕”?我们又该如何看待谷歌搜索业务的前景呢?
一、盯上搜索“蛋糕”
从定义上看,搜索本质是联合整合信息的能力,AI搜索更进一步,不用用户挨个点开链接了,直接给你答案,相当于升级版的搜索。根据业内人士透露,有超过一半用户在AIGC产品里输入长句子,甚至最后还带问号。
这意味着,搜索几乎是AI应用最成熟的场景。Perplexity持续的流量增长就是最好的证明。在a16z 最新发布的月访问量前 50 的 GenAI 产品中,PerplexityAI 排名高居第七。根据Similarweb数据,Perplexity今年前三月的流量分别为4560万、4954万和6149万。
尽管用户体量依然差谷歌几个量级,但Perplexity仍然在一个Google长期霸占的市场,利用AI获得了阶段性颠覆的成果。
在这样的成绩面前,Perplexity也水涨船高。2024 年 1 月,Perplexity 筹集了近 7400 万美元,估值达到 5.4 亿美元,3 月初,Perplexity 以 10 亿美元的估值完成了 5600 万美元的融资。根据 TechCrunch 最新报道,Perplexity 正在筹集至少 2.5 亿美元融资,最新估值在 25亿~30 亿美元之间。
在国内也一样。AI搜索秘塔是仅次于文心一言和Kimi的第三大AI应用产品。今年3月,秘塔的月访问量为721万,增长了551%。
对于OpenAI来说,高昂的估值和庞大的研发开支,迫使其需要寻求更大的商业化突破。
一方面,ChatGPT的流量和商业化遭遇了阶段性瓶颈。SimilarWeb网站数据显示,在经历了2023年初的爆炸式增长之后,ChatGPT 自2023年6月全球流量下降了9.7%,流量逐月起伏。
2024年2月,随着GPT store和Sora的发布虽有所回升,但全球流量环比仅增长1%,访问量为 16 亿次,还没有完全恢复到2023年5月达到的峰值。受限于月活起伏,ChatGPT付费用户规模也不到1000万。
纵观与AI匹配的大规模商业化场景里,OpenAI 的选择其实并不多,其很难跟微软去抢 ToB 的市场,也很难跟英伟达去抢芯片的市场,更难跟 Apple 去抢终端市场。放眼望去,谷歌手上的搜索是OpenAI为数不多的可行选择。
既有Perplexity的珠玉在前,AI搜索的商业化想象力也足够大。2023年,谷歌的搜索广告机创造了超过1750亿美元的收入,广告总收入占谷歌2023 年总收入的近 78%。即使在国内,被认为“没落”的百度靠着搜索一年也能赚1000亿。
二、大模型与搜索有何不同?
在很多人看来,Perplexity和大模型好像没什么太大区别。ChatGPT本身就能直接解答用户的提问,NewBing 也是默认搜索加整合答案。这样看来,OpenAI下场做搜索自然轻而易举。
但其实并非如此。以AI搜索Perplexity为例,大模型和Perplexity的区别就是,一个能用、一个好用。大模型本身能搜索不假,但也会出现很多问题。
比方说,生成式AI无法做到实时更新,且受限于训练数据,可能无法覆盖相对小众、缺乏通用性的长尾知识。同时,生成式AI对生成内容的可控性较差,存在“幻觉”问题,用户也难以对答案进行直接验证。
Perplexity所做的事情就是,把这些大模型搜索过程中出现的“坑”一个个都填掉,其中最重要的事情就是信息的实时性和准确性。
实时性方面,与ChatGPT等大模型依赖训练时的数据和语料获取信息不同,Perplexity基于底层传统搜索引擎开发而得,能够及时抓取最新的信息。
准确性方面,Perplexity做了两件事情:减少幻觉和内容溯源。为了减少幻觉现象,Perplexity引入了RAG技术(检索增强生成),RAG的作用好比是给模型提供一本教科书,让它根据特定的问题去查找信息,通过关联外部知识来提高答案的准确性,有效减少了语言模型中出现的虚假信息,使得生成的回答更准确可信。
与此同时,Perplexity还对生成的每一句话都附有引用链接,在保证可靠性的同时便于用户溯源或深入研究。
不仅如此,Perplexity还对召回和排序环节的算法做了创新,保证内容的有用性及引用的精确程度。其中,“召回”指根据搜索指令从数据库中获取尽可能多的正确结果,“排序”指根据用户搜索内容的相关性对召回结果进行排序,决定了搜索引擎的精确程度和性能上限。
来源:中金研究部
这也让Perplexity成为当下综合性能最好的AI搜索引擎。在2023年4月的论文中,斯坦福的研究人员对YouChat、Perplexity.AI、NeevaAI及BingChat四个生成式搜索引擎进行了人工评估。结果显示,Perplexity.ai生成内容有用性的评分为4.56分,排名第二;引文召回率和精确度为68.7,排名第一;在泛搜索引擎类的体验中,综合能力位于最前列。
除了在信息准确、可靠上,Perplexity在响应速度上也花了很多功夫。比如,Perplexity通过自研推理堆栈,让其内容生成速度快于GPT类通用模型。在模型侧,公司对GPT-3.5进行微调,在降低成本的同时进一步提升响应速度。
Perplexity的成功,也证明了一件事情:比起模型能力,产品本身单点的价值创造和体验的优化,是一个更为重要的事情。这意味着,即使是拥有先进大模型的OpenAI,想要提供更好的用户搜索体验,上述产品层面的优化一样也少不了。
不过相比Perplexity等产品公司做模型,模型公司做产品的难度要小得多。
三、谷歌基本盘稳固,但隐忧不小
去年年初,ChatGPT的爆火,很多人断言,ChatGPT的出现几乎就等于敲响搜索的丧钟。按前谷歌第23位员工、Gmail的创建者之一Paul Buchheit的说法,像ChatGPT这样的人工智能聊天机器人将摧毁谷歌,就像当年搜索引擎彻底干掉黄页电话簿一样。
2023 年 2 月,微软宣布将推出由 OpenAI 的 GPT 技术提供支持的新版 Bing 搜索引擎,以追逐谷歌的搜索主导地位。当时,微软表示,仅1%的搜索广告市场份额就价值 20 亿美元的年收入。
但是,一年时间过去了,谷歌基本盘依然稳固。StatCounter 的数据显示,微软的搜索引擎在 2024 年 1 月的市场份额仅为 3.43%,比去年同期增长不到 1%。与此同时,谷歌的市场占有率为 91.46%,相比去年仅下降了不到 1%。
去年以来,谷歌的搜索广告收入逐季提升。到了今年一季度,搜索广告同比增长14%,甚至高于市场预期。
在产品层面,去年谷歌也推出了搜索生成体验(SGE),使用人工智能来生成复杂问题的上下文答案。看上去,谷歌似乎逐渐找到了用户体验到商业化之间的平衡。可以说,Bing的挑战失败了。
所以,当OpenAI的搜索即将上线,谷歌的股价也几乎没有变化。也就是说,市场并没有给这个事件的影响给予充分的定价。
但客观来说,不同于Perplexity,OpenAI的潜在威胁可要大得多。一方面,OpenAI天然拥有庞大的用户池,ChatGPT手上有十几亿的用户规模,日活在5000万左右。另一方面,OpenAI自身拥有模型,且性能更加先进。一旦agent最后成为AI时代大一统的终极产品,拥有更先进模型的OpenAI,将会给谷歌造成更大的麻烦。
换句话说,比起Perplexity,显然OpenA更有可能给谷歌搜索业务带来冲击。尤瓦尔·赫拉利在《人类简史》中写过这样的一句话:历史的铁律就是,事后看来无可避免的事,在当时看来总是毫不明显。
本文来自微信公众号:乌鸦智能说(ID:wuyazhinengshuo),作者:小黑