2024-10-01 11:26

“不发模型、不上新功能”的OpenAI开发者大会，还能期待啥？

本文来自微信公众号：硅星人Pro （ID：gh_c0bb185caa8d），作者：周一笑，原文标题：《“不发模型、不上新功能”的OpenAI DevDay，开发者们还能期待啥》，题图来自：AI生成

去年，OpenAI在旧金山举办了一场引发业界轰动的开发者大会（DevDay 2023），推出了一系列新产品和工具，包括支持128K上下文的GPT-4 Turbo，API价格下调，新的Assistants API，具备视觉功能的GPT-4 Turbo，DALL·E 3 API，以及大幅改进的JSON模型，还有命运多舛的GPTs和类App Store平台GPT Store。

CEO Sam Altman信心满满地说：“我们希望你明年还能来，相较于我们正在精心打造的新成果，今天发布的东西会显得非常过时”，再次拉高外界预期。

在刚刚经历新一轮高管团队离职风波之后，OpenAI年度盛事DevDay 2024即将到来，所有人心中都有一个疑问：接下来会发生什么？

然而，今年OpenAI的DevDay却悄然改变了调性。先是宣布了大会的举办形式进行了调整，从大型活动转变为一系列路演式的开发者互动环节。

更令人意外的是，根据官方的剧透，OpenAI在DevDay期间不会发布其下一代主要旗舰模型，而是将重点放在API和开发者服务的更新上。

简而言之：下一代模型还在炉子里烤着呢，所以干脆只字不提。

DevDay不再是模型大会，这次真的是“开发者”大会了。

一、没有GPT-5的Devday，开发者们还有哪些期待？

尽管OpenAI宣布今年的DevDay不会发布新一代旗舰模型，但业界对此次开发者大会仍抱有诸多期待。根据猜测，OpenAI可能会重点推出长期推理和函数调用等新API能力，同时增强模型的代理能力，为开发者提供更多自主权和与其他API集成的可能性。

4o语音模式的API也备受期待

硅星人也与几位开发者进行了交流，了解他们对API的真实需求，多模态和性能成为关注的焦点。

Talkme是一款面向海外市场的语言学习ToC产品，CEO贾子健告诉硅星人，对于出海的AI开发者，通常都会选择OpenAI的API，少量会用Gemini和Claude。Talkeme使用的主力API是OpenAI，加上Gemini辅助。

“GPT-3.5 Turbo基本已经淘汰，大家都会转成4o-mini或者4o去完善业务逻辑。更复杂的tob类SaaS产品，可能会考虑GPT-4，能力更强，相对也更贵。”

o1目前也在Talkme的考虑范围内，但由于成本较高，目前仅限于实验性功能的预研，无法投入到ToC应用正式生产当中。

“o1的能力的确很强，但从工程的角度来说，一部分用o1、一部分用4o、一部分用4omini，基本上就可以覆盖开发场景。”

对于OpenAI API的期待，贾子健表示主要有三点：

第一是低延时。

第二是低延时下的多模态能力，“我们的多模态能力目前一部分在用4o，一部分在用Gemini”。

第三点是更稳定的JSON输出。“OpenAI的公众化还没有那么严谨，更多可能是科学家算法主导，导致OpenAI输出的JSON不是很稳定，很多场景反而不如自己写正则，去解析输出的文本内容。在这个维度上，谷歌比OpenAI做得好，如果能有稳定的JSON输出，对于开发者是比较受益的。”

价格方面，“除了o1，其他价格都比较便宜”。

Cocos引擎运营总监、老菜喵主理人晨阳从国内AI产品的角度进行了分析。他告诉硅星人，从目前能力和响应速度来看，OpenAI仍然是最强，另一方面，国内的开发者考虑的更多是合规性和使用的ROI，而国内的Qwen，豆包，MiniMax，文心等模型也都在追赶，部分产品优惠后的性价比不弱于OpenAI。

他表示，“未来需求一定是多模态的，传统的HTTP Post请求会被逐渐淘汰，国内的豆包已经率先用上了WebRTC，网传OpenAI WebRTC即将开放。所以未来市场除了模型的质量，要考虑综合的效果，ASR，TTS，WebRTC等结合，从这个角度考虑，国内的产品在整合上优势更大，价格战有机会取得优势。”

语核科技面向企业场景应用，技术合伙人池光耀希望OpenAI API的更新能够提供两方面的改进：内置一些工程化能力来减少或检测幻觉；对于o1，提供更灵活的使用选项，允许用户指定是否在本次请求中使用复杂推理功能。

二、AGI可以等，缺钱不能等

DevDay的焦点转变与OpenAI近期在生成式AI发展中采取更多渐进步骤的战略相契合。

公司目前正在优化其旗舰模型GPT-4o和GPT-4o mini，在生成式AI的竞赛中面临保持技术领先的挑战。根据某些基准测试，OpenAI似乎已经失去了绝对的技术领先地位。

其中一个原因是获取高质量训练数据的困难，据Originality.AI的数据，全球排名前1000的网站中，已有超过35%封禁了OpenAI的网络爬虫。

麻省理工学院数据溯源计划的一项研究发现，约25%来自“高质量”来源的数据，已经被限制使用在训练AI模型中。

为了应对这些数据获取的挑战，OpenAI已经与出版商和数据经纪商签订了一系列高额授权协议。

压力的另一方面来自运营公司的成本，据路透社报道，OpenAI预计今年营收将达到37亿美元，同时将亏损50亿美元，主要用于支付运营服务成本、员工薪资和办公室租金等，这还不包含员工股权激励等其他大额支出。

为了解决资金问题，OpenAI正在推进新一轮的融资，9月初，融资消息传出，OpenAI可能以1500亿美元的估值获得65亿美元的投资。据消息人士透露，这一估值取决于OpenAI能否将其公司结构转变为与其竞争对手Anthropic和xAI类似的盈利模式。

不过最新的消息是，最新一轮65亿美元的融资，苹果已经决定不参与。此外，上周首席技术官、首席研究官和研究副总裁先后离职，也为OpenAI增添了不确定性。

尽管OpenAI首席财务官Sarah Friar于9月27日向投资者透露，本轮融资已超额认购并计划在月底前结束，但融资谈判仍未最终敲定，参与者和具体金额仍可能有所变动。

专注于API，或许与OpenAI在财务上面临的压力相关。

根据FutureSearch公布的研究报告和相关数据，OpenAI年收入为34亿美元，其中76%的营收来自ChatGPT付费用户（ChatGPT Plus、ChatGPT Enterprise和ChatGPT Team订阅），API接口服务贡献了公司15%的收入，约5.1亿美元。

API驱动的服务模式曾经帮助AWS这样的平台迅速成长，越来越多的企业利用亚马逊的API开发新产品或服务，从而产生网络效应，其生态系统的价值不断增长。

虽然OpenAI目前API带来的直接收入占比不高，但是在ChatGPT增速放缓、OpenAI更多地采取了渐进式的步骤来发展生成式AI的背景下，通过提供更好的API或许可以为公司开辟新的市场机会，并促进与其他企业的合作。

没有GPT-5，高管出走，向营利公司转型，这一系列的事件都预示着商业化已经成为Sam Altman迫切需要解决的问题，OpenAI将更多考虑利润，而不是实现AGI。

很长一段时间以来，Sam Altman用高超的技巧，一边操纵公众情绪，一边经营自己的事业，堪称科技界CEO中的翘楚。

但如果你在旧金山的OpenAI DevDay上听到他谈论关于OpenAI计划转向“盈利模式”的讨论，请不要感到意外。

本文来自微信公众号：硅星人Pro （ID：gh_c0bb185caa8d），作者：周一笑

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

文集：

拥抱“AI”

AI创投日报

频道：前沿科技