正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-06-26 15:57

Mac版ChatGPT应用开放,4o语音功能却再鸽一个月?

本文来自微信公众号:新智元(ID:AI_era),编辑:耳朵、庸庸,原文标题:《今日起,Mac版ChatGPT应用人人可下!GPT-4o语音功能却再鸽一个月》,题图来自:视觉中国

文章摘要
本文介绍了Mac版ChatGPT应用开放,但GPT-4o语音功能推迟一个月的情况。

• 💻 Mac版ChatGPT应用向所有用户开放

• 🗣️ GPT-4o语音功能推迟一个月

• 🤖 ChatGPT能够识别情绪和非语言暗示

适用于macOS的ChatGPT桌面应用程序现已可供所有人使用了!该应用程序是在今年早些时候公司的春季发布会上与其他更新一起发布的。


只是,OpenAI推迟了千呼万唤的GPT-4o新高级语音功能的发布,理由是需要进一步改进。


ChatGPT Mac版本向所有用户开放

虽然语音功能爽约,但ChatGPT桌面应用程序,这回终于向所有用户开放了,不过只适用于MacOS,Windows用户仍要等待。


像之前演示的那样,用户可以和ChatGPT随时展开聊天,各种类型的输入ChatGPT都可以hold住,用户可以上传文件、照片以及屏幕截图,还可以选择文档中的一段文本向ChatGPT提出问题。



1. 快速调用


桌面应用程序使ChatGPT比其网站更易于访问,因为用户可以使用Option+Space键盘快捷键从任何屏幕触发它。


屏幕会弹出一个类似于Apple Spotlight功能的搜索栏,用户在其中输入问题就好。



2. 截图


编程时遇到问题,直接截屏提问:




3. 上传文件


随时把文献交给GPT批量总结:




4. 问你想问


快捷地问你想问的任何问题:




5. 分享图片


读图(手写体也可识别)




6. 搜索对话


可以搜索你和GPT的聊天记录:




点击ChatGPT搜索栏右侧的耳机图标,就可以从桌面开始与ChatGPT进行语音对话。


只可惜,Sky已经下架,用户现在仅可以从四种语音风格中进行选择:Breeze、Ember、Cove 和 Juniper。



自推出以来,适用于macOS的ChatGPT只向高级用户开放。目前,该应用程序开始向所有用户开放。


除了macOS之外,OpenAI已经拥有适用于Android和iPhone的原生ChatGPT应用程序。


只是,ChatGPT的Windows桌面应用程序还在制作中,感兴趣的用户将不得不等到“今年晚些时候”。


GPT-4o语音功能推迟交付


Open AI表示,他们还需要一个月的时间来实现之前在春季发布会上演示的GPT-4o语音功能。


原定计划是“在6月底向一小部分ChatGPT Plus用户推出alpha模式”,但现在这个日期向后推迟了一个月,也就是说,灰度测试将在7月开始,所有Plus用户都能使用则要等到秋季。


延迟出于两个方面的考虑:安全和用户体验。


OpenAI希望提高“模型检测和拒绝某些类型内容的能力,从而可能防止滥用并确保负责任的AI交互”。他们还专注于“改善用户体验并准备好他们的系统来处理数百万用户的计算量,同时保持实时响应”。



我们在此分享春季更新中演示的高级语音模式的最新进展,我们对此仍然非常兴奋:


我们原计划在6月底向一小部分ChatGPT Plus用户推出alpha模式,但还需要一个月的时间才能达到推出的标准。例如,我们正在改进模型检测和拒绝某些内容的能力。我们还在努力改善用户体验,并准备将我们的基础设施扩展到数百万用户,同时保持实时响应。


作为迭代部署策略的一部分,我们将从一小群用户开始进行alpha 阶段,收集反馈并根据所学知识进行扩展。我们计划在秋季让所有Plus用户都能使用。具体时间取决于能否达到我们的高安全性和可靠性标准。我们还在努力推出我们单独演示过的新视频和屏幕共享功能,并将随时向您通报这一时间表。


ChatGPT先进的语音模式可以理解并回应情绪和非语言暗示,让我们更接近与人工智能进行实时、自然的对话。我们的使命是为您带来这些贴心的新体验。


对OpenAI“拖延症”发作,网友们表示见怪不怪,推迟发布属于基操。



笑死,“几周”变成了4~6个月,OpenAI基操。


网友甚至预判“计划在秋季让所有 Plus 用户都能使用”,言外之意是取秋季三个月的deadline。



别忘了各位,秋天包括九月、十月、十一月。


甚至有用户表示对OpenAI诚挚的道歉和延期的理由并不买账,发出退订威胁——OpenAI屡次向用户“画饼”,对用户的承诺提前好几个月就侃侃而谈,功能的交付却永远在路上。



或许到了我该退订的时候了…



太长懒得看:过早的承诺然后永远在交付途中…又一次这样了。


也有网友用Claude研发速度和成果催促OpenAI,别睡了!起来交货!



Claude正在交货,OpenAI睡得正香。


可以看出,网友对OpenAI推迟语音功能的大众情绪多为失望和不满,质疑OpenAI是为了吸引Plus用户订阅而夸大其词。


reddit也新开了一个讨论贴,为什么人们对4o语音如此不耐烦或渴望?


GPT-4o是OpenAI公司最新的GPT4版本,在发布会上最引人注目的特点就是像与真人对话的丝滑流畅,甚至能识别用户的情绪且响应速度极快。


因此,对于语音功能的完全上线用户们自然是望眼欲穿,语音作为多模态输入的一个重要部分也将大大提高用户的使用效率和使用体验。


发布会展示的语音功能对话0延迟,功能交付却延迟一个月,期待落空自然引起大批用户的不满。


高赞评论是:



不耐烦的情绪一方面来自OpenAI的种种前科,一方面来自对于这种屡次“事前画饼,事后道歉”的行为,把话说满,虚假宣传,对于大公司来说,会逐渐消磨它在大众中的公信力。



如果他们解释说发生了他们无法控制的事情,我会多宽容谅解一些,但也不会太多……


像这样提前宣传的事应该是违法的。


如果你的所有客户目前无法购买到商品那么你就不能宣布或泄露它。


这并非没有先例。在首次公开募股(IPO)的静默期,你不能进行市场推广或任何形式的公开宣传。


这个规定一直沿用至今,我敢肯定,公开市场对这个规定也没有异议。



问题是他们提到的是“未来几周”。要知道,OpenAI 是一家大公司,人们当然很容易相信他们。你知道,就像你在网上买东西一样,在你真正收到东西之前,你无法确定它是否是真的。如今,连评论都可能是假的。

灰度测试


TestingCatalog发布的一则推文透露了与语音功能灰度测试有关的讯息:“It is coming!”



ChatGPT Voice Alpha 邀请界面


ChatGPT iOS应用程序再次更新,新增了一些UI组件,这些组件可能会向即将推出的高级语音模式的alpha测试者展示。


在邀请界面,我们可以看到最重要的几点在于:


  • 自然对话,实时回复;

  • 具有情绪和语气,能够感知和回应幽默、讽刺等;

  • 视频聊天,轻点相机图标即可分享周边环境。


虽然一些用户对推迟表示失望,但OpenAI专注于在发布前把事情做好是有道理的。希望当高级语音模式和新的多模式功能真正到来时,将会带来更好、更安全的体验。


参考资料

https://x.com/OpenAI/status/1805716393524183136?t=_quxGDt--E6_HFJvehEvsg&s=19

https://x.com/OpenAI/status/1805679342439284831?t=ITNAuGXckpW5FHJmcROyng&s=19

https://www.reddit.com/r/OpenAI/comments/1do6va2/why_are_people_so_impatient_or_eager_for_4o_voice/

https://x.com/testingcatalog/status/1805288828938195319


本文来自微信公众号:新智元(ID:AI_era),编辑:耳朵、庸庸

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: