扫码打开虎嗅APP
出品|虎嗅科技组
作者|余杨
编辑|苗正卿
头图|视觉中国
8月1日消息,OpenAI 将推出新的ChatGPT高级语音模式,不过,这仅限于少数订阅ChatGPT Plus的人。
事实上,OpenAI 在5月的GPT-4o发布活动中就展示过该功能,一个响应式AI助理角色。后出于安全原因被推迟。
在5月的直播演示中,OpenAI 工程师和首席技术官Mira Murati聚集在手机周围,展示新功能。他们先是鼓励助手在编造睡前故事时更具表现力,然后突然要求它切换到机器人声音,最后要求它用歌声结束故事。不仅如此,他们还让助理看看手机的相机看到了什么,并让它对屏幕上可见的内容做出反应。助理在说话时也能够被打断,并在担任翻译时没有继续提示的情况下做出回应。
当时,OpenAI 首席执行官奥特曼(Sam Altman)在X上神秘地只发布了一个字:“Her”。奥特曼曾经直言,《Her》是他最喜欢的电影。
那是2023年的9月,在耶尔巴布埃纳剧院舞台上绿叶茂盛的背景下,奥特曼会见了Salesforce首席执行官Marc Benioff,与拥挤的观众一起,谈论了生成人工智能,一直谈到他最喜欢的科幻电影——《Her》的一切。
“我喜欢《Her》。《Her》做对的事情——比如人们如何使用人工智能的整个互动模型——这是令人难以置信的预言,”奥特曼说。
《Her》由Spike Jonze执导的一部科幻爱情片,摄于2013年,这部电影讲述了在不久的将来人类和数字人之间的爱情故事。主人公西奥多(Theodore)是一位写信人,细腻而深刻,能写出最动人的信。他刚刚结束了与妻子凯瑟琳的婚姻,仍然沉浸在心碎之中。碰巧他接触到了最新的人工智能系统OS1,它的数字化身萨曼莎(Samantha)有着迷人的声音,温柔而幽默。西奥多和萨曼莎很快发现他们非常兼容,有双向的需求和欲望,人机友谊最终发展成为一种超越世俗理解的爱情。
不难发现,电影聚焦于人的孤独、人与人工智能的未来关系走向等话题,融合了新奇的科幻设定与传统的浪漫气息,科技的魅力在真人与虚拟互动中的一帧帧爆发,并且准确地踩在了一众 AI 工程师的G点,一定程度上或可说,《Her》是许多如今推动人工智能不断演绎的造梦者的梦的起点。
不得不提的是,《Her》中萨曼莎的精彩配音表演即来自斯嘉丽·约翰逊(Scarlett Johansson)。斯嘉丽甚至一面没露,只凭着声音就拿到了罗马影后。奥特曼也为之着迷。
早在5月,奥特曼就曾邀请斯嘉丽为ChatGPT 4.0系统配音。遭到拒绝之后,奥特曼锲而不舍地请求斯嘉丽重新考虑。
而随后发布的语音——Sky——也因和斯嘉丽声音高度相似,进而引发了诉讼风险,并成为Open AI 发布推迟的“安全原因”之一。
不过,推迟发布的这一个月里,OpenAI 也更进了一步。
在OpenAI 的演示活动中,OpenAI 员工仍然能够打断聊天机器人,并要求它以不同的方式讲述故事,聊天机器人游刃有余地调整并响应。但在ChatGPT的新模式里,只有它与配音演员一起制作的四个预设声音,并且,ChatGPT不能模仿其他人的声音,包括个人和公众人物。
OpenAI 发言人Taya Christianson表示,公司与100多名外部红色团队(试图攻击技术以发现弱点的人)一起测试了语音模型的能力。还添加了新的过滤器,可以识别和阻止某些生成音乐或其他受版权保护的音频的请求,显示了 OpenAI 在安全问题上的努力。
令人玩味的是,在影片的最后有这样一段对话。
西奥多向萨曼莎发出疑问:“你同时还在跟几个人聊,你同时爱上了几个人?”
萨曼莎回答道:“8361,641。”
当西奥多沉醉于萨曼莎的温柔感性体贴之时,身为OS的萨曼莎同时要处理与别的用户之间的关系,这段人机之恋最终以此为节点走向了BE。
与扎克试图介入现实世界的梦想相比,奥特曼对《Her》的梦的执着,或许从某种维度揭示了OpenAI 与Meta的不同。