正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-07-05 14:23

黄仁勋最爱用的AI搜索,又更新了什么?

本文来自微信公众号:APPSO (ID:appsolution),作者:Selina,原文标题:《黄仁勋最爱用的 AI 产品重磅升级,体验后我找到了这些细节》,题图来自:视觉中国

文章摘要
黄仁勋最爱用的AI搜索Pro search功能升级,能更好处理数学计算、编程任务等,采用多步推理解决问题。文章介绍了Pro search的使用场景和优势,以及Perplexity在专业领域的表现。

• 💡 Pro search功能升级,处理数学计算能力提升

• 🌟 Perplexity在专业领域有深度回答和提问能力

• 🔍 GraphRAG技术提高AI搜索的关联性和人性化

正挣扎在盗用内容争议中的Perplexity,“顶风”发布了最新的Pro search功能。


不知道是不是受到争议的影响,这次的更新技术细节不多,亮点在于能够更好地处理数学计算问题、编程任务等。



当然,作为看家本领,检索和回答的能力也得到提高,采用多步推理来解决复杂提问,并且展示每一个环节,让用户看到每一个步骤。



两个关于Pro search的重要信息:


  • 普通用户每四小时里可以使用5次Pro search,付费用户不限次数


  • 为教育机构、政府机构、非盈利组织提供付费折扣


不过,到底有了多大提升,得试了才知道。


测试热身,考简答


为了了解Pro search的基本使用流程,我们先从简单的生活问题开始——各地都进入了高温天气,夏天了有什么解暑方式?


Pro search的启动键在输入框右下角,拨动变色,即代表开启。


开启后默认保留,即便结束了一个对话,另起一个新对话时,也默认在Pro search模式下进行,对于不限次数的付费用户来说就很方便了。



运行后,会渐次出现Researching下拉框,这是模型的“思考工作”,完成后可以点击右边展开键查看详情。



继续点开可以看到信息来源,算是集合了不少中文信源,来源也很多样。从回答上来看算是中规中矩,“多喝水”是怎么都不会出错的方法。


考数学,本轮更新重点项目


数学计算能力是本次更新的亮点,正好Runway更新了Gen-3模型,那么就让Perplexity来计算一下:


如果购买标准套餐,在账号里已经有400积分的情况下,能用Gen-3生成多少视频?



可以看到它摆开架势,列式子,做计算。不仅成功检索到标准套餐的费用、所提供的积分数量,也能完成加法和除法。


根据它的计算,总共能用Gen-3生成102.5秒视频,如果按10秒一条的顶格条件,是十支视频。那么,换算成真金白银呢,每生成十秒的视频,要花多少钱?



这里Perplexity出现了“断片”:它能提取自己之前的计算结果,也就是102.5秒。可是,它却忘了第一轮计算时,套餐月费是按12美元/月计算的。


在这轮计算里,它错用了高级套餐,月费25美元/月,计算出0.24美元作为每秒成本。



这是个明显的失误,且不论第一轮计算时,明确指定了“标准套餐”,即便是高级套餐,有折扣的年付方式折合每月是28美元,无折扣的月付方式直接是35美元——压根没有25美元这个数字


在追问之下,它承认自己的确搞错了价格。



考专业,深度提问


数学考试算是有惊无险吧。Perplexity一直以来主打深度,那么专业考试表现如何呢?


正好,昨天微软研究院开源了GraphRAG,也是一项用于AI搜索的技术,这不就是Perplexity的“本专业”,那么来问问它好了。



从searching这一步来看,长问题会被分解成更小的问题(相比之下,上一个简单提问里,是靠变换近义词)



第一个信源便是微软的开源页面,很即时。回答方面,Perplexity把问题拆分成了两个小问题,做了平行回答:一是GraphRAG是什么,二是它自己在用的技术。


正想着追问细节之后,这一轮的免费次数已经耗尽了,得等四小时之后的刷新。



每四小时5次免费的额度,比每24小时刷新要大方。但说多也不多,必须要思考一下,怎么提问才能最有效地表达需求。倒逼用户提高自己的提问能力,这也是AI搜索的“传统艺能”了。


总体来说,Pro search是一个在用户体验方面更贴心的升级


不再是僵硬的“输入提问-得到回答”,而是能看到Perplexity处理问题的步骤,怎么拆分、怎么检索,调用了哪些信源。


AI搜索的潜力股,或许是它


Perplexity在有深度、专业性强的问题上,更能体现出实力。那么,深度提问时提到的“GraphRAG”,究竟是什么呢?


RAG是Retrieval(检索),Augmented(增强),Generation(生成)的缩写,是目前主流AI检索所使用的策略,也是Perplexity自己采用的方式。



局限性体现在,它像一个缝缝补补的“内容裁缝”。


比如,在深度提问里,“GraphRAG是什么?Perplexity是如何使用RAG做检索?”这两个小问,的确可以分开回答,但两者之间显然是有关联的。


传统RAG无法捕捉到信息之间的关联,只能僵板地罗列。对于简单提问,或许无伤大雅。但在深度提问上,在把问题分解成更小的子问题之后,却没法有机地展示这些子问题之间的联系。


GraphRAG技术,就意在通过建立信息之间的联系。在接到问题、返送回答之间,多了一个步骤:建立知识图谱。


人类的思考能力,体现在能够把自己所知道的、所掌握的,互相勾连,形成知识图谱。


对人工智能来说,为了做到这一点,除了要完成常规的数据提取、分割,还要完成对实体的识别、提取,并围绕实体,建立一个个“小圈子”。


“小圈子”本身的结构是自下而上,而它们之间又彼此相关,链接在一起,就能形成一个庞大的巨网。这让后续的回答生成环节,就有了更丰富的组成方式。


图片来自:微软研究院


上图中可以看到,右边基于GraphRAG机制,能够根据不同的主题,进行内容整合。


这岂不是意味着AI又更有“人味儿”了吗?怎么Perplexity这次更新没有用上呢?


不着急,微软研究院4月时发布对于这项技术的研究,昨天才正式开源。更重要的是,这项技术,更适用于私有数据集。


例如,知乎最新发布的大模型产品“直答AI”,就是以知乎站内回答为优先、网络内容为补充的形态,建立的数据集。


相比之下,Perplexity不想把自己局限住,而是放眼整个互联网。凭借海量数据和大模型能力,Perplexity一度是英伟达掌舵人黄仁勋最爱用的产品之一。


上周,Perplexity陷入版权争议,接连被福布斯、WIRED点名道姓,指控它绕过媒体门户网站的反爬机制,硬是把内容抓进自己的语料库里。


AI搜索领域,数据库“弹药充实”的确非常重要,不然OpenAI也不会接二连三地与各大媒体谈合作。


但另一方面,有效地理解、分析和使用搜集来的数据,将会起到越来越关键的作用。


归根到底,用户对AI搜索的期待,绝不仅仅是一个“更多、更快”的搜索引擎,而是“更强”。


本文来自微信公众号:APPSO (ID:appsolution),作者:Selina

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: