扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2024-06-29 12:06

Perplexity AI 获巨额融资,陷剽窃风波

本文来自微信公众号:APPSO (ID:appsolution),作者:胡漠杨,原文标题:《Perplexity AI 再获巨额融资,同时又深陷「剽窃风波」》


据彭博社最新报道,软银集团旗下的愿景基金2号,即将投资美国人工智能初创公司Perplexity AI。


知情人士透露,软银的这次投资金额为1000万至2000万美元,而Perplexity本轮的融资总额也超过了2.5亿美元。


这轮融资预计会让Perplexity的估值提高三倍,可能达到25亿至30亿美元,将使其成为业内估值最高的公司之一。


Perplexity的目标是利用人工智能与Google搜索展开竞争。


作为一家初创独角兽公司,他们的核心服务是提供一个「答案引擎」,这与传统的搜索引擎有着本质的区别。


用户不需要通过多个结果来寻找自己的问题的主要来源,而是直接获得Perplexity为你找到的答案。


Aravind Srinivas曾经是OpenAI的一名研究科学家。在离开OpenAI后,他于2022年8月创立了Perplexity。


Perplexity想要为用户提供快速、准确的答案,而无需用户在海量信息中自行筛选。


Aravind Srinivas在接受The Verge采访时,也同样说道:


我们关心的是真实性和准确性。


作为「世界上首个对话式答案引擎」,Perplexity回答界面十分干净。


在Perplexity的结果页面里,上方是信息来源,中间是答案,下面是延伸问题。


其独特之处在于将ChatGPT式的问答和传统搜索引擎的链接列表相结合,开创出了一种全新的搜索体验。


早前在接受Wired采访时,黄仁勋说自己「一直在用Perplexity」。


当然,他也觉得ChatGPT挺好。


在采访时,黄仁勋尤其对计算机辅助药物发现领域感兴趣,他「差不多每天都用这两个」来做调研:


或许说,你想了解计算机辅助药物发现领域的进展。


那你得先围绕这个话题来建一个框架,然后从那个框架问些更具体的问题。


尽管Perplexity的商业模式在理论上具有吸引力,但其作为中间者的角色,可能会引发一些内容创作者的担忧。


与Arc Search和Google Gemini一样,在搜索问题后,Perplexity也是直接提供答案结果。


如果这样做,就必定会影响原始内容网站的流量和广告收入。


像Google和百度这样的传统搜索引擎,其大部分资料都是爬虫自动抓取的,以便于用户通过关键词进行搜索。


爬虫可以迅速检索并整理网站的信息,但它不会无脑抓取所有内容。网站一般在建立时,会设定一个Robots协议文件(也即robots.txt)。


通过这个文件,网站就可以告诉搜索引擎的爬虫:哪些网页可以抓取,哪些不可以。这是一种非强制性的协议,主要依赖于爬虫开发者的遵守。


大多数搜索引擎和爬虫开发者都会尊重Robots协议,不会抓取那些网站明确禁止抓取的内容。这样做是为了尊重网站的隐私和版权,同时也是为了避免法律问题。


如果不遵守这个协议,那么爬虫就会强行访问网站的内容。这样做带来的另一个结果,就是一些网站的付费墙可能会失效。


在前不久,有人在使用Perplexity时,尝试让其总结关于埃里克•施密特(Eric Schmidt)秘密无人机项目。


然而,在Perplexity给出的结果中,可以看到里面有几个片段是从Forbes的独家报道摘取而来的,而且还给出了Forbes创作的一张原创插图。


后来Forbes也主动尝试用Perplexity生成内容,在经过对多篇文章主题检索后,他们发现自家文本内容经常会出现在Perplexity给出的答案中。


其中,有很多文章是带有付费墙的独家报道。Perplexity绕过了Forbes的付费墙,未经授权使用了许多原创图片和文本。


不光如此,Perplexity给出的答案正文中也没有出现资料来源。唯一的署名是一些可以链接到这些媒体的图标,但是它们都非常小且容易被忽略


除了Forbes,另一家著名媒体Wired也在控诉Perplexity。


Wired在早前写了一篇关于Perplexity的文章,同样报道了Perplexity在试图使用爬虫那些被阻止访问的网站内容。


但后来,奇葩的事情出现了:Perplexity「盗用」了Wired的这篇文章——尽管这篇文章是关于它自身的,而且Wired在其网站的相关文件中也明确阻止了Perplexity访问。


Wired的开发人员Robb Knight对后台数据进行了研究。


在大量分析后,Wired确定了一个有很大概率与Perplexity有关的特定IP地址,并且这个地址并不在Perplexity的公开IP范围内。


为了平息内容创作网站的情绪,Perplexity的首席商务官Dmitry Shevelenko在接受Semafor采访时表示,Perplexity正在与出版商开发收入共享计划。


Perplexity尚未公布这些合作伙伴相关的细节,但Dmitry Shevelenko称会尽快公布其计划。


Aravind Srinivas也在接受Fast Company的采访时回应了这一问题:


事实上,Perplexity并没有忽视robots.txt,它只是使用了忽视它的第三方抓取器。


不过,Aravind Srinivas拒绝透露第三方抓取器的名称,也没有承诺会要求该抓取器停止违反robots.txt。


如果尝试向Perplexity询问:「作为一个AI搜索引擎,你如何看待未经授权就引用他人文章?」


它会给出如下回答:


看来Perplexity自己也知道,这样做在一定程度上是有风险且不合法的。


就拿新闻业来说,如果你要写一篇新文章,你会怎么做?


你会说「据《纽约时报》报道」,也就是引用别人的话。这也正是我们在做的事情。


Perplexity首席执行官Dmitry Shevelenko如此说道。


无论如何,还是希望Perplexity可以在合规的前提下,能继续创造出更有想法的AI工具。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: