2024-06-08 20:40

AI创新战：OpenAI必须走的突破之路

Tim在路上©

本文来自微信公众号：Tim在路上（ID：CNSF-2016），作者：Pulsar planet

时间回到2022年11月，此时英伟达的股价近乎腰斩，跌至不足3000亿美元。

就在这个时候OpenAI发布了ChatGPT聊天机器人，这一基于生成式人工智能的AI Bot，一时间成为了科技界的头条。此时，甚至Google创始人慌乱，回来紧急发布应对策略。因为在这个时候大家不知道它是如何实现的。

英伟达GPU芯片可以加速AI基础模型的训练，同时具有完善的CUDA平台，它抓住了向上的“新风口”，其股价开始回升，市值逐步恢复。

到2024年的今天，仅仅两年过去，英伟达市值达到3.012万亿美元，成为了全球市值第二的公司。

英伟达的GPU芯片依然在加速生产中，而且他们现在拥有至高无上的定价权，每个人训练大模型的公司都必须接受Nvidia用金汤匙喂养他们的东西。

当前H100的毛利率超过85%，可以说英伟达成了AI2.0时代最赚钱的公司，没办法卖“铲子”的总比“挖金矿”的要先一步挣到钱。

而对于这波风口上的大模型公司来说，所有人都在关注无利可图的支出还将会持续多久。当前大模型创业公司的明确目标还是在赶上甚至超越OpenAI，以及构建更大性能更好的模型，来挣取更多的预期收益。

而OpenAI也一样，OpenAI必须不断推出新的震撼世界的产品，同时推出可以直接触达用户的产品，否则它将陷于Meta和Google包围之中。

优势在缩小

当前许多公司在聊天机器人ELO方面与OpenAI最新的GPT-4相差无几，而在上下文长度和视频模式等某些方面，一些公司已经领先。

前不久Sora和GPT-4o的发布，并未引起像ChatGPT刚发布时引爆的破圈讨论风潮，这是因为ChatGPT刚发布时，我们并不知道它是如何实现的，我们也不知道如何追赶。而现在我们基于开源基础模型，可以大概判断出其实现的技术方案，只是需要时间来进行复现而已。

显然，只要有足够的计算能力，最大的科技公司都可以匹敌OpenAI的GPT-4。据传，阿里最新发布的Qwen-2.0的开源模型已经可以比拟GPT-4 Turbo，Meta的Llama 3 405B也将在开源的同时匹敌GPT-4，Gemini 2 Ultra已经在各方面超越GPT-4 Turbo。

OpenAI现在的优势之一是他们在收集使用数据方面一直处于领先地位，但这种情况相信很快就会改变。所以OpenAI才说人才是第一位的，其他没有什么是不可替代的，OpenAI也在不断的开出百万美元的年薪从Meta和Google等竞争对手的公司挖人。

如果OpenAI没有不断的推出新的技术产品，可以说其技术优势正在逐渐缩小。

微软与OpenAI的合作关系

虽然说微软宣布将为OpenAI投入超过100亿美元的资本支出，而且这其中还有一大部分事用于推理，以便在自己的产品和服务中部署OpenAI模型。

由于OpenAI的怪异结构，微软也并未完全押注于OpenAI，一大部分资源被用于微软自己开发的模型上。

OpenAI是一个非营利组织，其主要目标是创造安全且造福全人类的通用人工智能(AGI)。OpenAI可以而且会违反允许微软访问OpenAI模型的协议，而微软对此没有任何追索权。

这是因为OpenAI仍然是一家完全独立的公司，由OpenAI Nonprofit管理。微软是无投票权的董事会观察员，没有控制权。AGI明确地排除了所有商业和IP许可协议。对于微软来说，最令人担忧的是，OpenAI董事会可以在没有任何微软投票的情况下随时决定他们已经实现了AGI。

虽然说现在OpenAI的产品可以通过微软来直达消费者用户，但他们之前并非完全背靠背的合作关系，OpenAI依然需要寻求独立的产品路线。

而微软也在减少对OpenAI的依赖，包括Copilot和Bing计划。微软最新发布的Phi-3模型，使用来自大型模型的大量合成数据训练小型模型，效果非常出色。其次，微软也正在使用MAI-1~500B参数MOE模型，利用了Inflection预训练团队及其数据集，并结合了微软自己的一些合成数据，来训练自己的GPT-4类模型。

终端产品已成王道

OpenAI的缺点其实非常明显，它并没有拥有像Meta和Google可以更直接地接触消费者终端流量产品。

相比于Google的浏览器，Meta的聊天软件，ChatGPT的用户量还是比较少的，而且其中大多数只使用过几次，不会继续使用它。

未来的大多数可以预见的消费者，将通过现有平台来使用大语言模型，包括Google、Instagram、WhatsApp、Facebook、iPhone/Android。

虽然Meta尚未找到如何将赚钱的方法，但他们的Meta AI（由Llama 3 70B提供支持）已在Facebook、Instagram和Whatsapp上可用。

并且已宣布的推广范围已扩展到包括美国在内的14个国家/地区，这些国家/地区的总人口为11亿。大量用户已经可以使用比ChatGPT免费模型更好的模型。Meta AI正处于其增长曲线的早期阶段，距离实现其32.4亿每日活跃用户群的目标仅完成了三分之一。

Google也宣布将AI融入了Workplace办公工具中，使得Gmail、Google Drive、Docs、Sheets和Slides都可以一键使用AI，同时未来也将打造新的搜索—-用AI组织搜索，同时Gemini生成式人工智能模型添加到广告服务中，探索赚钱方法。

所以在这个背景下，OpenAI推出了自己的手机APP和桌面APP，用于直接面向用户，一方面便捷用户的使用，减少使用上复杂操作的时间成本；另一方面可以直接面对用户和占有用户。

此外，OpenAI也积极与苹果合作，打造新一代的siri，占有这个巨量的终端用户群体。如果OpenAI真的iPhone上独家提供服务，那么OpenAI将一举成功占用最重要的终端市场。

开打价格战抢占用户

价格战的序幕应由DeepSeek-V2的问世拉开，这款产品以其卓越的性能和低廉的运行成本，成功超越了Meta的Llama 3 70B。

DeepSeek-V2的定价策略极具竞争力，它不仅在成本效益上明显优于市场上的其他竞争模型，而且其价格之低，甚至打破了风险投资支持的推理API提供商之间的价格战局面。这些提供商在为Meta和Mistral模型提供服务时，已经面临着亏损的压力。

DeepSeek-V2的推出，无疑在这场激烈的市场竞争中掀起了新的波澜。

DeepSeek声称，一个由8卡H800 GPU组成的节点可以实现每秒超过50，000个解码token的峰值吞吐量，其API定价为每百万tokens输入1元、输出2元。即使在这样的情况下，依然可以实现高达70%以上的毛利率。而且DeepSeek-V2没有照搬国外的开源模型，针对MoE、RoPE和Attention都有全新的创新。

紧接着，智谱AI、字节豆包大模型和阿里Qwen-Long API也都相应的大幅下调价格。百度则直接宣布ERNIE Speed和ERNIE Lite两款模型免费。

OpenAI则对于非企业用户优先采取了免费优先的策略，虽然有一定的频次限制，但对于非企业用户来说是足够的。这标志着他们将去年的定价模式发生了重大商业模式转变，现在开发者和企业进入了完全补贴消费者的时代。

通过贴补消费者来增加用户使用终端频率和习惯，抢占终端用户市场。对于这些没有大规模终端使用的大模型公司来说，如果创新遇到瓶颈，那么这些拥有直接终端用户的企业公司，将可能快速将其包围。

国内价格战时间线：

DeepSeek发布全球最强开源MoE模型：2024-05-06，DeepSeek-V2（32K上下文）API的定价为：每百万tokens输入1元、输出2元

用大模型API就上bigmodel.cn！：2024-05-11，智谱AI的GLM-3 Turbo API价格调整为1元/百万tokens（输入输出同价）

2024春季火山引擎FORCE原动力大会上:2024-05-15，字节Doubao-pro-128k（128K上下文）API的定价为：每百万tokens输入5元、输出9元；Doubao-lite-128k（128K上下文）API的定价为：每百万tokens输入0.8元、输出1元

智谱AI最新推出Batch API：2024-05-21，支持的模型以及价格：GLM-4 API价格为50元/百万tokens，GLM-3-Turbo API价格为0.5元/百万tokens（输入输出同价）

降价，立即生效！：2024-05-21，阿里云Qwen-Long API价格调整为每百万tokens输入0.5元、输出2元。

免费，立即生效！：2024-05-21，百度宣布ERNIE Speed和ERNIE Lite两款模型宣布免费。

战火必将燃向芯片

OpenAI面临的最大风险就是芯片。

尽管OpenAI的芯片野心已经传闻了一段时间，最近OpenAI对谷歌TPU芯片的顶尖人才开始了大胆的偷猎行动。

OpenAI自己做芯片和基础设施也是迫不得已。

一方面，与购买Nvidia芯片相比，它大大降低了计算成本。当前Google的TPU建设速度非常快，而且成本会非常便宜。Meta和亚马逊正在将其内部硅片的产量提升到不同程度，这让他们的大模型获得了计算成本优势。

另一方面，OpenAI公司目前处境尴尬，不能完全依赖微软的芯片和云服务，因为两者的关系紧张且微妙，而且微软正在认真制定自己的AI计划。

从长远的角度来看，OpenAI在成本节约方面可能难以从微软那里获得显著的优惠，因为微软的商业策略倾向于通过向"外部"用户出租其内部芯片和云服务来实现盈利。OpenAI有着更为深远的愿景，它渴望自主设计芯片和系统，以更贴近制造成本的方式打造定制化的解决方案，从而实现成本效益的最大化。

然而，OpenAI对于微软芯片的设计缺乏必要的控制权，这可能导致微软提供的芯片及其系统无法完全满足OpenAI的特定需求。这种局限性可能会影响OpenAI在实现其技术目标和优化成本效益方面的灵活性和效率。

总结

当前AI大模型还处于发展的初期，巨量上升的空间使得资本可以无限制的投入，然而这种无限制的投入会持续多久呢？

在整一条产业上，目前只有卖芯片的英伟达赚到了钱，其他公司都是在赚取对未来期望的钱。一旦OpenAI所带来的创新性不足，那么也就意味着AI2.0将进入平台期。

OpenAI必须利用当前的优势，快速的占领终端用户，吸纳自己的用户群体。否则一旦式微，Google和Meta这种已经拥有巨量流量的现成产品公司，将具有非常大的后发优势。

所以说，终端产品成为市场竞争的关键，Google和Meta等公司拥有直接接触消费者的平台和产品，而OpenAI则需要通过推出自己的APP和与苹果等公司的合作来拓宽用户基础。通过价格战和补贴消费者将成为抢占市场份额的重要手段。

最后，芯片或许会成为OpenAI面临的最大风险。尽管OpenAI有意自主开发芯片和基础设施，但与微软的合作关系紧张，OpenAI需要在芯片开发和成本效益之间找到平衡，以保持其在AI领域的领先地位。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

AI原生产品日报

频道：前沿科技