正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-11-06 19:03

OpenAI未来猛料全曝光,奥特曼承认自己最大弱点是产品

本文来自微信公众号:量子位,作者:衡宇,题图来自:AI生成

文章摘要
采访奥特曼揭示OpenAI未来发展方向和挑战。

• 🚀 OpenAI聚焦推理模型提升科学贡献

• 🤖 强调AI在医疗和教育领域的巨大潜力

• 📚 奥特曼承认自身在产品策略方面的不足

奥特曼在OpenAI伦敦开发者日上的最新采访,终于完整释出!


40分钟的采访过程中,奥特曼除了聊OpenAI未来模型发展方向、Agent、和最尊敬的竞争对手(就是此前碎片式走漏风声的几个问题)外,还就Scaling Law、半导体供应链、基础模型竞争成本、该雇佣什么年龄段的员工等十多个问题进行了快问快答。


当被问及站在OpenAI CEO这个位置上,有什么是他过去和现在都缺乏充分准备的。


奥特曼毫不避讳地表示:产品!


总体来说,我的弱点在产品方面。


现在公司需要我在这方面有更强大、更清晰的愿景。



有趣的是,如果让现年39岁的奥特曼回到23、24岁,他会考虑在垂直方向做一些AI相关的东西。比如辅导人类学习的AI Tutors,或者AI律师、AI CAD工程师什么的。


以下附上这场精彩采访的采访全文,部分段落在不更改其原意的基础上有所删改。


最后还有11个快问快答彩蛋~


内容速览:

1. o1代表的推理模型这个方向对OpenAI非常重要。

2. 创业公司的主要业务不要对着现有模型打补丁。

3. 难道大家已经忘了几年前的模型表现多糟糕吗?其实才过去没几年。

4. 同样的价值下,更广泛、更容易获得、更便宜,那就代表着“非常强大”。

5. “开源”和“闭源但提供API”都很合理。

6. 真正有趣的事应该是让Agent做一些人类不会或不能做的事(比如高并发推进项目)。

7. 模型确实是贬值的资产。

8. 如果你训练的模型落后,或者没有一个有粘性和价值的产品,那么的确可能很难获得投资回报。

9. OpenAI将对o1进行多模态改进;在o1新范式下,预计基于图像的模型将迅猛发展。

10. 对OpenAI最自豪的事情,是反复去做一些新的、完全未经验证的事情。

11. 世界上很多有才的人因为他们在糟糕的公司工作(或者其他原因),没办法充分发挥潜力。

12. 员工缺乏经验并不意味着没有价值。

13. Scaling Law仍将有效,并持续相当长的时间。

14. 用互联网技术变革来类比AI浪潮是一个不好的习惯,更愿意用晶体管来类比。


OpenAI伦敦开发者日奥特曼采访实录


Q1:当我们展望未来,未来OpenAI更多的是o1这样的模型,还是说可以期待参数更大的模型?


A:我们当然希望全面推进,但推理模型这个方向对我们来说特别重要。我们寄希望于用推理来解决许多多年来我们期待去完成的事。


比如,推理模型能够为新的科学做出贡献,帮助编写难度系数很高的代码——我认为这在很大程度上能推动世界向前发展。


所以可以期待一下o系列模型的快速改进,这的意义将非常重大。



Q2:也是从OpenAI的未来计划出发,您怎么看待作为非技术创始人通过开发无代码工具来构建、拓展AI应用程序?


A:肯定会有那一天的。


我们的第一步是让那些懂得写代码的人具备更高的生产力;但落到最后,还是希望提供真正高质量的无代码工具。


目前已经有一些有意义的(无代码)工具,但如果想完全用无代码的方式来创建一家初创公司,还需假以时日。


Q3:有一个创始人提问说,当下,OpenAI显然处于技术栈中的某个位置,OpenAI将会走多远?如果花费大量时间来调整RAG系统,是不是一种浪费时间的行为——因为OpenAI终将在应用程序中涵盖这一部分?


A:我们通常会回答说,OpenAI将尽最大努力,并且坚信我们一定会让推出的模型变得越来越好。


如果你创建的是一家以“给小漏洞打补丁”为生的公司,不管OpenAI是否顺利、正确地推进工作,对你的影响都不是那么大。


换个角度来说,如果你的公司会因为“OpenAI的模型越来越好”而更加成功,你肯定会为此感到高兴的。


就比方说甲骨文公司偷偷跟你说,OpenAI的o4会强得突破你的想象,你绝对乐开花了。


当然了,如果你非要挑一个o1-preview表现得不好的领域去深耕,勉强以此为基础,那你肯定会觉得我们的下一代模型不会像想象中表现得那么好。这就是我想告诉初创公司的。


我们相信,OpenAI身处的改进轨道相当陡峭,现在模型的缺陷将会被后来者解决和弥补。


Q4:从一个创始人的角度来看,OpenAI可能会在哪些地方(而不是另一些地方)取得成功?相信投资者们也很想了解这个问题,大家都不想投资亏钱。


A:OpenAI将创造出数万亿美元的市值,具体来说,是通过使用AI来构建以前觉得不可能或者不切实际的产品与服务,来创造出市值新高。


我们希望推出的模型非常棒,让使用者无后顾之忧,只需要用它做想做的事情就是了。


在GPT-3.5的时代,95%的初创公司、人,都在打赌模型不会变得更好。


其实他们做的事情,我们早就预料到GPT-4可以搞定,可以做得更好,不会再出现3.5时代模型会出的错了。如果创业者/开发者们做的事只是补全某一代模型的某个缺点,你就会发现这个缺点越来越无足轻重。


难道大家已经忘了几年前的模型表现多糟糕吗?其实才过去没几年。但是机会遍地都是,所以乍一看,给现有模型打补丁是不错的机会(所以就不去搞AI助教或者AI医疗顾问什么的)


所以我才说,一开始的时候,95%的人肯定认为模型不会再改进,只有5%的人打赌模型会发展得越来越好。


不过我觉得现在的情况已经不是这样了。


大家现在反而觉得GPT-3.5进化到GPT-4的速度会是一种常态,但事实并非如此。好在我们内部员工都非常勤奋,我们知道将会发生什么。


Q5:软银孙正义说,AI每年都会创造9万亿美元的价值,这将抵消他所认为的每年9万亿美元的支出。看到这个说法的时候,您怎么想?


A:从数量级上来说,现在已经差不多了。AI显然会导致大量资金支出,同时创造大量的价值。


这种情况发生在每一次大型技术革命的过程中,AI显然是其中之一。


明年将是OpenAI向下一代系统大力推进的一年。


刚才咱们谈到什么时候会出现无代码软件Agent,我无法给定一个准确的时间,但可以畅想一下,如果任何人都可以描述他们想要的整个公司的软件,这将为世界带来多少经济价值。


同样的价值下,更广泛、更容易获得、更便宜,那将非常强大。


还有一些其他的例子,比如我之前提到的医疗保健和教育,这两个领域对世界而言价值数万亿美元。


如果AI能够真正以不同于以往的方式实现这一点,我认为它带来的经济价值的具体数字根本不是重点,更别提到底是9万亿还是1万亿了。


但可以肯定,AI创造的价值确实令人难以置信。



Q6:开源是一种非常重要的方法。您如何看待开源在人工智能未来中的作用?OpenAI内部讨论过“我们应该开源所有模型或其中某些模型”吗?


A:毋庸置疑,开源模型在生态中非常重要,而且现在市面上也有非常好的开源模型。


但我认为提供良好的服务和API也是有意义的——这很合理,人们会选择适合自己的方式。


Q7:您如何看待当今Agent的定义?对你来说,Agent是什么?


A:我没有充分考虑过这个问题,但我可以给Agent一个长期任务,并且尽可能少地去监督它的执行过程。


Q7':您认为人们对Agent的看法其实是错误的吗?


A:可能我们都没有一个准确的了解,但我们都知道一些重要的指标。


比如人们在谈论代他们做事的AI Agent时,常常举的例子是让Agent去预定餐厅。Agent可能在线预订,或者给餐厅打电话订座。


确实,Agent可以帮忙做一些事节省时间。不过我认为真正有趣的事,应该是让Agent做一些人类不会或不能做的事。


打个比方,Agent不是打电话给具体某家餐厅订座,而是联系300家餐厅,找出哪家最适合我。如果打过去的电话都是Agent接的,那就更酷了!因为人类无法大规模并行推进这种事情。


再举个更有趣的例子。


Agent可能更像一个非常聪明的同事,你和它合作一个需要耗时2天或2周项目,Agent可以自己执行,还做得很好,在必要的时候它会跟你沟通,最后交出一份出色的成果。


Q7'':这是否从根本上改变了SaaS的定价方式?SaaS通常按用户数量定价(席位收费),但现在AI实际上在替代劳动力。你如何看待未来的定价方式?


A:我只能猜测一下,我真的不知道。


我可以想象一个世界,你可以要求说“我想要1/10/100个GPU不断地为我工作”,这就不会按席位收费,而是根据持续处理这个问题的计算量来定价。


Q7''':我们是否需要为Aengts的使用场景构建特定的模型?


A:它当然需要大量的基础设施,但我觉得o1模型指出了通向能够出色完成Agent任务的模型的道路。


Q8:每个人都说模型是贬值的资产,模型的商品化非常普遍。您对此有何回应和思考?当你考虑到训练模型所需的资本密集度不断增加时,我们是否会发现“这个领域需要大量的资金,但实际上只有很少人能做到”会发生逆转?


A:模型确实是贬值的资产,但这并不意味着它们不值训练投入的成本。况且你训练模型的时候会产生积极的复合效应,让你能更好地训练下一个模型。


我们从模型中获得的实际收入证明了这项投资的合理性——当然,并非所有人都能做到这一点,而且有很多人在训练模型这件事上重复造轮子。


如果你训练的模型落后,或者没有一个有粘性和价值的产品,那么的确可能很难获得投资回报。


OpenAI非常幸运地拥有ChatGPT,拥有数亿使用我们模型的用户。


所以即便成本很高,我们也可以把这个天文数字分摊到大量用户身上摊薄它。


Q9:随着时间推移,OpenAI模型如何继续保持差异化?你最想专注于扩展这种差异化的领域是什么?


A:推理是我们当前最重要的关注领域,我认为这将解锁下一次在创造价值方面的巨大飞跃。


因此,我们将在各个方面改进模型,我们将进行多模态工作,并添加其他功能,我们认为这些功能对人们希望使用这些模型的方式非常重要。


Q9':你如何看待推理和多模态工作,包括挑战和你想要实现的目标?


A:我希望它能顺利实现。这显然需要一些努力才能完成。但是人类的婴儿和幼儿时期,即擅长语言之前,仍然可以进行相当复杂的视觉推理。


Q9'':视觉能力将如何随着o1的新推理范式而扩展?


A:在不剧透的情况下,我预计基于图像的模型将迅猛发展。你可以期待在图像模型方面的快速进展。


Q10:OpenAI如何在核心推理方面取得突破?除了Transformer之外,是否需要开始推动强化学习作为一种途径或其他新技术?


A:这是两个问题:我们如何做到,以及Transformer之后是什么。


首先,我们如何做到是我们的秘诀。


复制已知有效的东西真的很容易,原因之一是你有信心知道什么是可能的。在研究人员做了一些事情之后,即使你不知道他们是如何做到的,你也可以去复刻它。这一点可以在GPT-4和o1的复制版中得到验证。


真正困难的事情,也是我对OpenAI最自豪的事情,是我们反复去做一些新的、完全未经验证的事情。


很多机构、组织声称有能力去做这样的事,但实际上很少有真正做到的,包括AI领域之外。


从某种意义上说,我认为这是对人类进步最重要的投入之一。


我期待在退休后想写一本书,一本介绍我学到了些什么的书,分享我如何建立一个能够做到这一点的组织和公司文化的经验(而不是一个单纯复制他人成果的组织)