正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-05-16 21:00

上手实测GPT-4o:速度快到飞起,视频分析逊色

本文来自微信公众号:机器之能 (ID:almosthuman2017),作者:山茶花、Cardina,题图来自:视觉中国

文章摘要
本文介绍了GPT-4o的速度快、视觉能力惊艳,但在视频分析方面逊色。

• 💨 GPT-4o响应速度快到飞起,处理问题迅速

• 🌟 GPT-4o具备出色的视觉能力,能够辨认图片并生成板书图片

• 🤖 GPT-4o在多种场景下展现出令人惊艳的应用潜力

作为OpenAI有史以来最好的模型,GPT-4o究竟强在哪里?


你要知道,它是一个原生的多模态大模型,可以跨文本、音频和视频进行实时推理——能听、能说、能看、零延时、可打断,还会“看人脸色”。


更重要的是,它还免费。


赶紧薅一把,你会知道什么是真·科幻照进现实。


实测GPT-4o:速度飞快,视觉能力惊艳


打开ChatGPT官网,就会收到GPT-4o的试用邀请,点击“立即试用”即可进入对话页面。


如果没有收到邀请,可能是灰度测试阶段,稍等一会再重新进入。



然后,直接在下方的对话框中与其进行对话,系统会自动切换到4o版本。



值得注意的是,免费用户每天使用GPT-4o的次数有限,超出限制后要么升级为付费用户,要么只能用GPT-3.5。


Plus用户每月20美元,可享受高达5倍的消息上限。



许多AI公司正在将GPT-4o引入他们的界面。比如,Poe用户可以直接勾选GPT-4o服务。



我们简单薅了一把羊毛,还是被GPT-4o的效果惊到了。


首先,这个响应速度太爽了,快到飞起,问题刚输入,答案就哗啦哗啦出来了。



有网友发现制作单个html文件,仅需6秒;分析电子表格数据不到30秒......



其次,GPT-4o具备联网功能,可以搜集最新的新闻信息。


我们让它搜集2024年5月13日AI领域的新闻,它不仅对新闻进行了概括整理,还附上链接。



面对同样的要求,GPT-4却直接“罢工”:


最后,GPT-4o的视觉能力也挺惊艳。我们分别上传了樱桃和手写字迹的图片,让它辨认,全部回答正确。




网友发现,即使是1800年代的手写笔迹,也能出色地识别......了不起。



更离谱的是,GPT-4o还能生成板书图片,图中的板书简直跟人类写的没啥差别。要知道,对于大模型来说,“写字”可是一大难题。



贾樟柯纪录片《一直游到海水变蓝》的海报设计极具巧思,正着看是波涛汹涌的大海,正好扣题,倒过来则是连绵不绝的群山,又与片中核心思想相呼应。


我们就把这张海报“喂”给GPT-4o,还真别说,它回答的有板有眼,其中的深意均被get到。



不过,它的视频分析能力就逊色一些。


我们上传了一段7秒的《泰坦尼克号》经典片段,并让GPT-4o分析这个视频。


它迅速概括了该视频时长、每秒帧数以及分辨率等。不过,当问及这出自哪部电影以及画面中的男女主分别由谁扮演时,它“一问三不知”。



网友们疯狂“调戏”GPT-4o


眼下,给GPT-4o疯狂“整活”的视频已经在社交媒体上发酵,相当一部分可以归为“饭碗不保”系列。


当初ChatGPT刚上线,编辑们惊呼“完蛋,饭碗要砸”;GPTStore推出后,创业公司老板们大惊失色;年初时Sora只是放出了Demo视频,就让演员们人心惶惶……


如今GPT-4o一出,客服、家教、秘书、同声传译“岌岌可危”,就连导盲犬也要“下岗”。


1.“充当”导盲犬


GPT-4o现在可以实时查看和分析事物,可以帮助盲人描述当前环境,还能帮忙打车。唯一的bug是需要随时举着手机,要是能做成眼镜就更perfect了。




2.“充当”语音客服


给客服GPT-4o找茬儿?很难!哪怕是处女座!


一名叫Joe的小哥编了一个情景:ACMETelco寄的新iphone无法使用,他让一个GPT-4o充当客服,另一个充当他的助手,帮他处理这事。




助手小A先陈述了事情的经过,接着客服小B就开始“连环问”:


Joe是什么时候收到新iphone的?你能告诉我订单号码吗?设备有物理性损坏吗?Joe是想把iphone退回店里还是邮寄回去?你能告诉我Joe的邮件地址吗?你能帮他看一下我刚发的邮件吗?


最终,事情完美解决——AI客服对答如流,情绪稳定,找不出瑕疵。


3.“充当”家教老师


在一段广为传播的视频中,OpenAI邀请可汗学院的可汗和他儿子一起使用GPT-4o来辅导孩子做数学题。




期间,GPT-4o循循善诱,即使孩子回答错了,它仍耐心地进行指导和鼓励。帮助家长降低心梗几率的“人”有了,还要继续砸银子给家教吗?


4.“充当”会议秘书


大语言模型产品天生是个打工人的命,GPT-4o也不例外——当完了老师又被拉进了线上会议,跟一群“不正经”的员工们掰扯着经典的“猫狗大战”。


它不仅能充当会议秘书,总结会议内容,还能在领导cue时对答如流。




5.“充当”翻译


因为外语能力出色,GPT-4o还能充当同传,实时翻译,一如那条巴别鱼。


搞笑的是,GPT-4o还化身“中文老师”教一群老外学中文,不过水平“一瓶不满,半瓶咣当”,教出的学生个个自带口音,还夸人家“真是个语言天才”。




此外,GPT-4o还有一堆虚头巴脑的玩法,情绪价值直接拉满。


例如,凭借出色的语音合成能力,OpenAI总裁GregBrockman亮出了“拿手绝活”——让两个GPT-4o实时唠嗑。


下次开长途,如果将GPT-4o连接到汽车的语音功能,启动对聊模式,是不是就有人陪咱一路聊天了?


Greg甚至让他们即兴创作了一首歌曲,当然啦,唱功不咋地,旋律很“感人”。




下面这个视频中的小姐姐更“简单粗暴”。




直接让GPT-4o分饰两角——ChatGPT和O,其中ChatGPT声音低沉洪亮,像一把大提琴,而O则有着法国女高音般的激昂声音。


它们要以“五月十日的旧金山”这一主题来个男女二重唱,期间还各种刁难,例如加和声,节奏加快等,它通通能搞定。


GPT-4o还能自编自唱轻柔摇篮曲、唱生日歌,那调皮的语气活脱脱地就是个真人。




此外,朋友聚会可以请GPT-4o当裁判;出门面试,让GPT-4o当穿搭助理;讲冷笑话尴尬冷场,GPT-4o专业捧哏;心情不爽它闭着眼一顿猛夸……它还能化身“AI女友”,如果安在人形机器人上,《Her》就真的来了。




GPT-4o刚热了个身就遭到全网热捧,天知道后面还会整出什么石破天惊的玩法?


本文来自微信公众号:机器之能 (ID:almosthuman2017),作者:山茶花、Cardina

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: