正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2023-05-17 11:20

GPT-4的“APP生态”,初亮相让人有点失望

本文来自微信公众号:差评 (ID:chaping321),撰文:晚上吃早饭、及格,编辑:江江、面线,原文标题:《GPT-4终于可以联网、用插件了,我用完的评价是:拉了。》,题图来自:视觉中国


在被各种号称“炸裂”“颠覆”的 AI 新闻的轰炸下,说实话,差评君已经有点麻了。但这次,差评君打起来十二分的精神,因为真正有料的终于来了。


就在这两天,随着 OpenAI 向 Plus 用户全面开放自己的第三方插件,差评君也有了使用插件的资格。


只要是 ChatGPT 的付费用户,在设置里打开“Beta features”里的“Web browsing”和“Plugins”,接下来,只要在聊天页面选择需要启用的功能,就能在对话中使用了。


不过要注意的是,这个“Web browsing”和“Plugins”只能二选一,并不能同时使用。


由于这两个功能都只能单独使用,所以,我们先尝试了一下 ChatGPT 自带的网页搜索功能。


我们都知道,GPT-4 的模型数据集只收集到 2021 年 9 月份,所以我问了它一个最近很火的游戏,王国之泪。



这次它终于摆脱了单机模式,直接上网搜索了“王国之泪”的关键词,然后找到了“王国之泪”的维基百科。在阅读相关内容后,输出了回答,而且还顺便给咱做了一个翻译。


这么来看,联网了的 GPT-4 的大脑,又扩容了。



不过呢,当我想要些更细致的信息时, GPT-4 虽然会尝试去浏览网页,但,都进不去。



于是我转头去试了试 NewBing ,就没发现有类似的问题。


对此,差评君只能理解为 ChatGPT 在爬取国内内容时,爬取手段太过直白,直接被当成机器人给拒绝访问了。



不过,ChatGPT 的网络浏览也不是一无是处,相对于现在的 NewBing,当我需要一个更加详尽的回答时,比如让它对暴雪收购案进行评价,NewBing 可能是由于限制问题,只给出了短短几句的回答,数据还不新。



反观 GPT-4 不仅获取了正确信息,而且还对新闻的细节进行了总结。


唯一需要吐槽的,就是整个的生成过程速度有点慢。



而在第三方插件方面,这次刚好也有个名叫 KeyMate.AI Search 的工具能辅助搜索。



只不过,这插件反而不如上述 ChatGPT 自带的网页浏览功能好用。


虽然它按照要求给出了链接,但是点进去,是一个无法访问的视频……至于知乎,依旧拒绝访问。


最后,它出门左转在 IGN 的官网,帮我找了一些资料。



除了这个实时搜索,ChatGPT 其它插件的能力又如何呢?


首先,就是在学术教育和数学能力上,有了插件的加持,GPT-4 再也不是从前的那个数学小白了。


原因就是这个能做数学题的神器:Wolfram 插件。



相对于原始网站,加载了插件的 GPT-4 ,更像是一个老师。




在答案上,GTP-4 除了能帮你把过程给写出来,在解答过程中,当我要求它去对一些关键步骤进行解释时,这个回答就更详细了。



不过在一些难度更高的题目面前,Wolfram 就有点应付不来了。


比如这道 2022 年全国卷的数学最后一道大题,不管我尝试几次,它都没办法算出来。



但,问题也不止这一点,在我测试其它的一些插件时,比如这个 ScholarAI ,它是一个能帮我查找发表在 Springer Nature 上的期刊的插件。



因为这个插件只能寻找 Springer Nature 上的内容,所以在检索时,经常会搜不到需要的文章,其次,它也无法直接帮我们阅读全文,想要阅读全文,还得点进去下载 PDF。



这种检索方式,和平常的搜索引擎基本没啥区别,还不如去直接用搜索引擎去搜索,然后自己去选择需要的论文呢。


当然了,决定 ChatGPT 的插件功能好不好,最重要的还是能不能解决问题。


大家还记得,上次 OpenAI 在发布插件预告的时候,最让人惊艳的就是对生活出行的一键解决了。



正好,公司最近组织大家去日本大阪团建,这时候谁来做这个攻略就是个互相甩锅的大问题了。


于是,不出意料地,这个问题被大家丢给 GPT 的新插件了。


结果,万万没想到翻车竟然来的如此突然。


首先我使用了 Weather Report Data(天气报道插件,这里有个伏笔),Expedia(旅游插件)还有 OpenTable(订餐插件)这三个插件去帮忙制定这几天的行程。


问了问 GPT,5 月 24 日后 5 天的天气情况,并要求它给我推荐几个好吃的、好玩。


GPT 竟然傲娇起来了,5 月 24 号,也就是未来的天气竟然不能实时显示。



直接就让隔壁的好兄弟, NewBing 看了个大笑话。



甚至连,GPT 家族中的没有联网能力的小弟弟 GPT-3 ,都凭借 2021 年的数据猜出来。(虽然明显是猜的)



多少让我有些哭笑不得了。


不过,后来咱看了看这个 Weather Report Data,发现它只提供实时的天气信息,也就是没法提供未来的天气预测,而目前还没有其它的天气预报插件。


但这样我就要吐槽了,光看名字,这个叫做“Weather Report Data”的插件,怎么看都是一个常用的天气软件吧。



就这取名规则,放在苹果商店里,可是会因为“误导性语言”要被一顿毒打,逐出苹果生态圈的。


所以咱只好再重新切换使用“Web browsing”来查询,这才知道未来的天气。



如果这还算情有可原的话,那后面的内容可就不好洗了。


首先,在我没有明确说明从哪出发的情况下,它直接给我推荐了从北京飞往日本的机票。



虽然言语间非常诚恳,甚至还表示要给我推荐大阪的租车服务。


但是有一说一,你把我 5 月 24 号的出发时间擅自改成 6 月 15 号,是不是有点不礼貌了。


其次,这次旅行的重点自然是旅游了。



于是,这个推荐的第二个项目“大阪步行游”成功地引起了我的好奇。


一个大阪步行游,就要了咱们 50 美元,关键这是步行啊。难道里头有什么大家“懂的都懂”的项目?


结果点到链接里一看,原来是悄悄给我安利了旅游跟团业务,这可就有玩“植入广告”的嫌疑了呀。


没想到 GPT 竟然比微软还要早一步引进商业元素,这不纯粹了呀。


当然了,在使用插件处理这种复杂问题的时候, GPT 也不总是出岔子的。


比如,这一回,我要求它根据天气给我推荐一个适合的菜谱。



虽然问题挺不着调的,但它还是给了我一个希腊沙拉的食谱。


然后在计算价格的过程上,最神奇的事情发生了。GPT 给了我们一个链接,我们点击之后,就可以直接进入一个叫 instacart 的购物平台。



里头关于希腊沙拉的食材全都已经加入购物车了,只要选好数量,就可以直接付款下单。


而且,在这 70 多个插件里我还发现了一个非常牛 X 的应用——Zapier 。


Zapier 本身呢是一款基于 web 的自动化工具,它能够连接到各种应用上,让它们之间可以相互协作。


而现在有了 ChatGPT 的加持,直接在对话框内就能处理工作,甚至 ChatGPT 还能帮忙打打下手。


比如说有个会议需要通知员工,直接在对话框内输入要求就行。



ChatGPT 首先会生成一个 Zap 预览,并且会自动拟好邮件的内容给我们过目。


除此之外,这回一起开放的 GPT 插件中,其实还有许多神奇的小功能。


比如高分电影、书籍推荐:



你甚至还可以和它玩一款名为 Algorithma 的模拟生活的文字游戏:



粗看起来,是有点 AI 版 APP Store 的味道了。


不过,整个测试下来,差评君还是略显失望的,整个插件系统对 ChatGPT 带来的提升有,但也没有太大,并没有之前我们预期的那样,对咱们的生活带来非常明显的改变。


说到底,插件功能,其实是让 ChatGPT 对自身的一些薄弱环节进行加强,比如提升数学能力,提升数据检索能力,增加一些基本的网站操作能力等等。



但是现在测试看来,某些插件开发得不够完善,严重影响了咱们的体验,甚至给大家一种“不如不更新”的错觉。


差评君觉得,主要还是因为,这一回的插件功能其实是由第三方,也就是由一部分获得内测资格的开发者制作的,不免会出现水平参差不齐的问题。


然而话又说回来,在大模型即将成为平台和大基建的未来,应用生态这块儿,绝对是得迈的一道槛。


毕竟,即便强如微软,不也曾吃过生态的亏。


所以,未来 ChatGPT 在生态方面要是没有所突破的话,或者说没在应用品质上做出保证的话,目前的领先地位,也未必不会被后来者给超越。


不过,话虽如此,但是考虑到目前 GPT 的新功能其实刚刚小范围测试,还有充裕的试错空间。


而且程序嘛,哪有不出 BUG 的。咱们不妨耐心一点, ChatGPT 宇宙可能才刚刚开始。


图片、资料来源:ChatGPT


本文来自微信公众号:差评 (ID:chaping321),撰文:晚上吃早饭、及格,编辑:江江、面线

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: