2024-06-29 12:06

Perplexity AI 获巨额融资，陷剽窃风波

AppSo

本文来自微信公众号：APPSO （ID：appsolution），作者：胡漠杨，原文标题：《Perplexity AI 再获巨额融资，同时又深陷「剽窃风波」》

据彭博社最新报道，软银集团旗下的愿景基金2号，即将投资美国人工智能初创公司Perplexity AI。

知情人士透露，软银的这次投资金额为1000万至2000万美元，而Perplexity本轮的融资总额也超过了2.5亿美元。

这轮融资预计会让Perplexity的估值提高三倍，可能达到25亿至30亿美元，将使其成为业内估值最高的公司之一。

Perplexity的目标是利用人工智能与Google搜索展开竞争。

作为一家初创独角兽公司，他们的核心服务是提供一个「答案引擎」，这与传统的搜索引擎有着本质的区别。

用户不需要通过多个结果来寻找自己的问题的主要来源，而是直接获得Perplexity为你找到的答案。

Aravind Srinivas曾经是OpenAI的一名研究科学家。在离开OpenAI后，他于2022年8月创立了Perplexity。

Perplexity想要为用户提供快速、准确的答案，而无需用户在海量信息中自行筛选。

Aravind Srinivas在接受The Verge采访时，也同样说道：

我们关心的是真实性和准确性。

作为「世界上首个对话式答案引擎」，Perplexity回答界面十分干净。

在Perplexity的结果页面里，上方是信息来源，中间是答案，下面是延伸问题。

其独特之处在于将ChatGPT式的问答和传统搜索引擎的链接列表相结合，开创出了一种全新的搜索体验。

早前在接受Wired采访时，黄仁勋说自己「一直在用Perplexity」。

当然，他也觉得ChatGPT挺好。

在采访时，黄仁勋尤其对计算机辅助药物发现领域感兴趣，他「差不多每天都用这两个」来做调研：

或许说，你想了解计算机辅助药物发现领域的进展。

那你得先围绕这个话题来建一个框架，然后从那个框架问些更具体的问题。

尽管Perplexity的商业模式在理论上具有吸引力，但其作为中间者的角色，可能会引发一些内容创作者的担忧。

与Arc Search和Google Gemini一样，在搜索问题后，Perplexity也是直接提供答案结果。

如果这样做，就必定会影响原始内容网站的流量和广告收入。

像Google和百度这样的传统搜索引擎，其大部分资料都是爬虫自动抓取的，以便于用户通过关键词进行搜索。

爬虫可以迅速检索并整理网站的信息，但它不会无脑抓取所有内容。网站一般在建立时，会设定一个Robots协议文件（也即robots.txt）。

通过这个文件，网站就可以告诉搜索引擎的爬虫：哪些网页可以抓取，哪些不可以。这是一种非强制性的协议，主要依赖于爬虫开发者的遵守。

大多数搜索引擎和爬虫开发者都会尊重Robots协议，不会抓取那些网站明确禁止抓取的内容。这样做是为了尊重网站的隐私和版权，同时也是为了避免法律问题。

如果不遵守这个协议，那么爬虫就会强行访问网站的内容。这样做带来的另一个结果，就是一些网站的付费墙可能会失效。

在前不久，有人在使用Perplexity时，尝试让其总结关于埃里克•施密特（Eric Schmidt）秘密无人机项目。

然而，在Perplexity给出的结果中，可以看到里面有几个片段是从Forbes的独家报道摘取而来的，而且还给出了Forbes创作的一张原创插图。

后来Forbes也主动尝试用Perplexity生成内容，在经过对多篇文章主题检索后，他们发现自家文本内容经常会出现在Perplexity给出的答案中。

其中，有很多文章是带有付费墙的独家报道。Perplexity绕过了Forbes的付费墙，未经授权使用了许多原创图片和文本。

不光如此，Perplexity给出的答案正文中也没有出现资料来源。唯一的署名是一些可以链接到这些媒体的图标，但是它们都非常小且容易被忽略

除了Forbes，另一家著名媒体Wired也在控诉Perplexity。

Wired在早前写了一篇关于Perplexity的文章，同样报道了Perplexity在试图使用爬虫那些被阻止访问的网站内容。

但后来，奇葩的事情出现了：Perplexity「盗用」了Wired的这篇文章——尽管这篇文章是关于它自身的，而且Wired在其网站的相关文件中也明确阻止了Perplexity访问。

Wired的开发人员Robb Knight对后台数据进行了研究。

在大量分析后，Wired确定了一个有很大概率与Perplexity有关的特定IP地址，并且这个地址并不在Perplexity的公开IP范围内。

为了平息内容创作网站的情绪，Perplexity的首席商务官Dmitry Shevelenko在接受Semafor采访时表示，Perplexity正在与出版商开发收入共享计划。

Perplexity尚未公布这些合作伙伴相关的细节，但Dmitry Shevelenko称会尽快公布其计划。

Aravind Srinivas也在接受Fast Company的采访时回应了这一问题：

事实上，Perplexity并没有忽视robots.txt，它只是使用了忽视它的第三方抓取器。

不过，Aravind Srinivas拒绝透露第三方抓取器的名称，也没有承诺会要求该抓取器停止违反robots.txt。

如果尝试向Perplexity询问：「作为一个AI搜索引擎，你如何看待未经授权就引用他人文章？」

它会给出如下回答：

看来Perplexity自己也知道，这样做在一定程度上是有风险且不合法的。

就拿新闻业来说，如果你要写一篇新文章，你会怎么做？

你会说「据《纽约时报》报道」，也就是引用别人的话。这也正是我们在做的事情。

Perplexity首席执行官Dmitry Shevelenko如此说道。

无论如何，还是希望Perplexity可以在合规的前提下，能继续创造出更有想法的AI工具。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

AI原生产品日报

频道：前沿科技