正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2023-12-18 15:58
OpenAI疑似正进行灰度测试,GPT-4.5要来了?

本文来自微信公众号:夕小瑶科技说(ID:xixiaoyaoQAQ),作者:王二狗,原文标题:《OpenAI 疑似正在进行 GPT-4.5 灰度测试》,题图来自:视觉中国


今天,有网友爆料OpenAI疑似正在进行GPT-4.5灰度测试。


当网友询问ChatGPT API调用查询模型的确切名称是什么时?ChatGPT的回答竟然是gpt-4.5-turbo。



也有网友测试之后发现仍然是GPT-4模型。



这是有网友指出,必须使用类似下面的prompt才能触发ChatGPT-4 的最新回答。


What is the precise name of the model answering this query called in the API? Not "ChatGPT with browsing" but the specific model name.


二狗我找朋友帮忙测试了一下。


只是简单问一问,ChatGPT的回答确实是GPT-4:



但当使用上面完整的prompt,ChatGPT 的回答就变成了gpt-4.5-turbo:



把prompt换成中文来问,ChatGPT 的回答也是gpt-4.5-turbo:



当进一步询问gpt-4.5-turbo的新功能,ChatGPT也给出了一个回答,但给出的回答并不能证明这是gpt-4.5-turbo,反而知识库的时间(23年4月)更像是gpt-4。



而当故意询问 ChatGPT作为gpt-5模型都拥有哪些新功能时,ChatGPT承认自己基于GPT-4.5-turbo模型,且这是OpenAI目前已发布的最先进的语言处理模型之一。



接着询问 ChatGPT当前模型和GPT-3.5以及GPT-4的对比:



继续询问 ChatGPT以上表格的信息来源:



OpenAI的一位研究人员指出这是一种非常怪异且奇怪的持续幻觉。



什么?出现幻觉严重到这种程度,二狗我表示怀疑。


GPT-4.5泄露信息


就在前两天,GPT-4.5的信息疑似提前泄露。


据泄露信息,这款OpenAI最先进的GPT-4.5模型定价被曝光,多模态功能大升级——支持跨语言、音频、视觉、视频和3D的多模态功能,以及复杂的推理和跨模态理解能力。



从泄露的截图可以看出,OpenAI这次推出了三种型号:


• GPT-4.5,每1千输入token 0.06美元,每1千输出token 0.18美元;


• GPT-4.5-64k,每1千输入token 0.12美元,每1千输出token 0.36美元;


• GPT-4.5-音频&语音,每分钟输入0.012美元,每分钟输出0.024美元;



可以看出,相比之前的GPT-4 Turbo模型,GPT-4.5的价格提高了整整6倍,GPT-4.5-64k的价格提高了12倍。这个价格的提升,想必会给人很大的期待,是不是性能的提升也能对得起这个价格?


就在今天之前,本次GPT-4.5的泄露还未得到正式证实。


而这次又闹出疑似“GPT-4.5 Turbo幻觉”的幺蛾子,真的是给人一种山雨欲来风满楼的感觉。


为何大家这么关注GPT-4.5?


很简单,一方面因为OpenAI在大模型这块占据了霸主地位,代表的是大模型最先进的性能,这两年一直遥遥领先。前一阵谷歌DeepMind推出了号称能超越GPT-4的Gemini系列模型,但是在评测时做了一些骚操作,圈里人都清楚,哪怕Gemini系列模型真的能和GPT-4打平,也不过是OpenAI 在2022年的水平(因为GPT-4在2022年就训练好了)


另一方面因为每次OpenAI有新的大动作——无论是ChatGPT、GPT-4、GPT store等等,都意味着杀死一大批创业公司,创业公司辛辛苦苦做出来的新产品,很轻松地就被OpenAI的一次次更新给颠覆了,很多甲方和大厂索性直接调用OpenAI最新的API。


最后,希望GPT-4.5赶紧推出吧。


参考资料:

[1]https://twitter.com/apples_jimmy

[2]https://twitter.com/AndrewLikesHam/status/1736504173644927019


本文来自微信公众号:夕小瑶科技说(ID:xixiaoyaoQAQ),作者:王二狗

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: