扫码打开虎嗅APP
出品 | 虎嗅科技组
作者 | 苏子华
编辑 | 苗正卿
头图 | AI 生成
OpenAI的算盘失算了。
OpenAI将一场原本可以2个小时讲完的发布会,拆成了12天,每天讲15分钟左右。这场精心策划的营销盛宴,给人制造了一种“生怕错过”的紧迫感。
然而,本以为可以吊足观众的胃口,但它成为了对手的靶子。在过去12天里,Google从未如此积极、密集地发布自家AI产品进展。每一次都是对OpenAI的狠狠狙击。
在此期间,Google先是发布了自己大语言模型Gemini 2.0,在外媒评测中,其在多模态能力和处理速度上相比openai的GPT-o1已经有明显优势。
接着,Google又发布了对标Sora的视频生成模型Veo 2,在实测中被认为很多方面好于Sora。比如,Voe 2 在生成视频的真实感和细节上更强,而Sora 在这些方面的表现相对较弱,更容易出现不自然的动作和物体;比如,Voe 2 可以让用户通过简单的提示来指定更多镜头类型和拍摄方式,使得视频生成过程更加灵活。
即便在第12天,OpenAI一扫此前11天的平淡,发布了新一代模型 GPT-o3,在各方面的性能上逼近AGI(通用人工智能),但用户并不买账。人们认为,GPT-o3依旧是“期货”,如同曾经的sora一样,短期内无法向用户开放。
更早些,根据非营利组织 METR 在11月发布的一项评测,Anthropic旗下 的大模型 Claude Sonnet 3.5,在7项测试中的5项都超过了 OpenAI 的 o1-preview。
不能说OpenAI不强了,它在3个月内连续发布两个顶尖模型GPT-o1、GPT-o3,但奈何被对手们步步逼近。
曾经断层式领先的openai,在2年的时间里从“神”变为了“优秀”,逐渐和越来越多的对手们站在了同一条起跑线上,甚至开始被超越。
12天的发布会,从万众期待,变为口碑下坠。
而在发布会之外,OpenAI的状况更是不容乐观。
为了尽快提高营收,OpenAI 首席商务官 Lionetti 表示,该公司一直在试图与医疗保健、制造业和法律公司、教育等行业客户达成合作。比如,OpenAI在今年5月发布了面向校园的 ChatGPT EDU,还招聘了美国在线教育巨头Coursera 的前高管,担任其教育业务负责人。
可惜,事与愿违。根据风投机构 Menlo Ventures 的数据,今年 OpenAI 在企业 AI 领域的市场份额从 50% 下降至 34%,而亚马逊支持的 Anthropic 的市场份额翻了一番,从 12% 增至 24%。
OpenAI从万众期待,到期望落空,再到市场份额迅速丢失,局面的急剧扭转是怎么发生的?
没有秘密了
就在OpenAI为期12天的漫长发布会期间,据the information报道,又有两位核心人物从OpenAI离职。
其中一位是OpenAI 元老级成员Alec Radford,他在2016年加入,曾经参与过GPT-1 到 GPT-4o 的研发。开源文生图大模型Stable Diffusion的创始人Emad Mostaque曾经如此评价Alec Radford:如果他离职了,那openai就垮定了。
伴随着他的离职,GPT-1、GPT-2两代模型的核心论文作者已经全部离开OpenAI。
可以说,2024年成为了这家公司发展历史上重要的转折年份。
在此之前,2022年12月1日,ChatGPT发布,2个月用户数突破1亿,全球互联网行业沸腾了,共识迅速达成:这是新时代的号角。于是,科技巨头、创业公司们集体追赶openai。截至2024年第一季度,全球人工智能大模型的数量已达到 1328个。其中,美国的占比最高,约 44%,中国则占 36%。
到2023年3月14日,OpenAI发布GPT-4,再次惊艳了世界,它的每一次更新迭代都在刷新着人们对AI的认知边界,它就是AI行业的灯塔。
到了2024年,似乎一切都变了。曾经创建起以上光环的人,密集地在这一年离开OpenAI,包括联合创始人 Ilya Sutskever 和 John Schulman、首席技术官 Mira Murati、GPT 创造者 Alec Radford,以及安全和产品负责人,以及刚加入7个月就在前不久离开的OpenAI 搜索主管 Shivakumar Venkataraman。
他们极少数是自己创业,大多数则是加入了OpenAI的竞争对手,比如谷歌、亚马逊、anthropic、xAI、META、微软等等。
他们优化大模型的路径几乎都是基于更多的GPU、数据和顶尖人才。
密切参与硅谷顶尖人才招聘的Databricks 的 AI 副总裁Naveen Rao最近在接受访谈时表示,随着顶尖人才频繁地在不同组织之间流动,几乎不再存在什么商业秘密了。
他是一位连续创业者,在将上一家公司 MosaicML 于 2023 年以 13 亿美元的价格卖给了 Databricks后,他开始负责 Databricks 的 AI 产品。数据分析公司Databricks在本月刚刚完成了硅谷历史上最大一笔融资,100亿美元。
在他看来,全球真正能够建立新的前沿大模型的研究人员数量小于1000人,这也是为何这些顶尖人才的争夺战如此激烈的原因。极少有一个行业,顶尖人才能够如此频繁地跳槽,“供不应求”的局面给了他们更大的自由和权力。
Naveen Rao说,在大模型赛道,研究人员在组织中拥有的影响力是前所未有的,一个研究人员的想法可以完全改变产品,对一家公司的未来产生巨大影响。
这是科技产业发挥个人英雄主义最好的舞台。
OpenAI核心人员的大量出走,无疑一边将崛起的秘密和影响力带给了对手,也一边瓦解了OpenAI的商业壁垒。
OpenAI的下一张牌GPT-5,依旧悲观
在OpenAI连续举办了12天发布会的最后一天——这个本应是“大喜”的日子,华尔街日报却披露了一则重磅消息:GPT-5的研发进展受阻。
据报道,自2023年3月GPT-4发布以来,OpenAI一直在全力推进GPT-5的研发工作。GPT-5项目的内部代号为Orion,至今已筹备了18个月之久。
作为OpenAI的最大投资者,微软原本希望能够在今年年中看到新模型的问世,但这一目标并未实现。
OpenAI已经进行了至少两轮大规模训练,每轮训练都需要几个月时间处理海量的数据,而每一次训练都会遇到新的技术难题。知情人士透露,单是六个月的训练运行,计算成本可能已经达到约5亿美元。如今,是否值得投入如此巨额的资金,已经让人动摇。
此外,大模型训练所需的数据一般来自于书籍、学术出版物、新闻文章、社交媒体帖子等各种渠道。经验表明,给大模型输入的数据越多,它的智能表现就越好。然而,参与Orion项目的研究人员表示,现有的互联网数据已经不再足够,他们需要更加多样化和高质量的数据。
这一观点与OpenAI已经离职的联合创始人Ilya Sutskever的看法一致,他曾指出,互联网上的数据接近枯竭。
有知情人士透露,OpenAI甚至开始探索所谓的“合成数据”——即由人工智能生成的数据,用以训练Orion。然而,研究表明,人工智能生成的数据往往会导致系统故障或产生无意义的回答。
为了训练大模型,行业急需新的解决方案,但什么方法才是最佳选择,业内依然没有达成共识。正如Ilya所言,“在过去十年的AI预测中,我几乎一直是对的,但现在,我完全不知道下一步会发生什么。”
尽管如此,部分业内人士认为,尽管大模型的能力发展可能面临瓶颈,但我们不必因此而过度焦虑。如今的大模型已经远超过去的AI技术,它们依然能够显著改变商业运营,甚至重塑整个行业竞争格局。
有AI投资人认为,AI的传播热度或许在下降,但AI领域每个月都有新的进展,大模型正在逐渐深入到不同场景和行业中,这些可能不那么容易出现在大众视野里。
可以说,现在正是人工智能产业的黄金时代,但OpenAI面临的挑战和危机,确实比以往更多了。
#我是虎嗅科技组编辑苏子华,关注 AI ,交流可加微信:13902473354,请注明身份