2026-07-03 21:33

OpenAI和Anthropic都要“自研芯片”,除了成本,更重要的是算力控制权

author_path 华尔街见闻
头图

本文来自微信公众号: 华尔街见闻 ,作者:赵颖


据The Information周四报道,Anthropic正与三星洽谈定制人工智能芯片事宜,并已启动自研人工智能芯片的早期开发工作。若该定制服务器芯片最终进入量产,这将成为Claude背后公司推进硬件自主化的重要一步。


这一动作被视为Anthropic追随OpenAI的信号。


OpenAI已更早推进定制AI芯片项目,并与芯片设计和制造伙伴合作,试图为ChatGPT等产品建设更独立,效率更高的计算基础设施。两家公司共同指向同一趋势,大模型公司正从单纯算法竞争,转向软硬件一体化竞争。


市场影响首先落在三条线上:英伟达等外部GPU供应商的议价环境,三星等代工厂在AI芯片订单中的机会,以及AI初创公司未来融资和上市节奏。


据巴伦财经报道,德银分析师近期建议OpenAI和Anthropic不应过久推迟IPO,原因之一正是自研芯片和算力基础设施需要巨额长期资本。


自研芯片首先是算力控制权问题


目前,训练和运行大模型需要大量高性能计算资源。AI计算市场高度依赖英伟达GPU架构,供需紧张使模型训练和推理成本维持高位。对OpenAI和Anthropic这样的模型公司而言,芯片不再只是采购项目,而是核心生产资料。


Anthropic的Claude模型需求在2026年显著增长。TradingKey报道称,Anthropic高管此前披露,公司年化收入已超过300亿美元,而2025年底约为90亿美元。业务扩张推动算力需求快速上升,也放大了外部芯片供应不确定性对公司运营的影响。


Anthropic目前仍依赖多种第三方芯片方案,包括Alphabet旗下Google设计的TPU,以及Amazon自研芯片。报道称,Anthropic还与Google和Broadcom达成长期TPU供应协议,该协议与其此前承诺的500亿美元美国计算基础设施投资计划相关。


这意味着,自研芯片并不等同于完全摆脱外部供应商。更现实的目标是掌握核心设计能力,形成技术备选项,并提升未来商业谈判中的筹码。


成本只是入口,软硬件协同才是关键


自研芯片最直接的理由是降低成本。通过定制ASIC,AI公司可以围绕自身模型架构优化计算流程,减少通用芯片中不必要的模块,从而提高能效。若Anthropic芯片成功流片并部署,报道称其可能显著降低API调用成本,并影响企业AI应用市场的定价结构。


但成本并不是唯一变量。SemiAnalysis创始人Dylan Patel在访谈中强调,AI效率提升的最大空间并不只来自更快芯片,而来自模型,内核和硅片之间的协同设计。他认为,单层优化可能带来两倍提升,但跨层协同可能带来远大于简单相乘的效果。


这解释了为什么OpenAI和Anthropic都在走向更深的硬件参与。模型架构并非天然适配所有芯片。Dylan Patel称,OpenAI模型更偏稀疏,Anthropic模型相对更稠密,两者在矩阵乘法单元尺寸、注意力机制结构、专家层形状等方面存在显著差异,这使得两家公司在硬件选择上天然倾向于不同方向。"实际上,按照OpenAI模型的发展方向,使用TPU对他们而言可能是糟糕的决策;而按照Anthropic和谷歌模型的发展方向,用GPU训练对他们而言同样可能是糟糕的决策。"他说。


换言之,自研芯片不只是把英伟达GPU替换成自己的芯片。真正目标是让模型从设计之初就能贴合底层硬件,从而改善推理速度,能耗,吞吐量和单位经济性。


对英伟达不是立刻替代,而是长期制衡


自研AI芯片从研发设计,流片验证,到最终量产部署,通常需要18至24个月。即便Anthropic与三星顺利达成合作,其自研芯片也很难在短期内实质性替代现有算力供应。


OpenAI则推进更早。TradingKey报道称,OpenAI选择与Broadcom和TSMC合作,计划在2026年下半年部署首款推理芯片。相比Anthropic,OpenAI在定制芯片路径上更主动,也更接近落地阶段。


大模型公司自研芯片的方向,确实指向降低对英伟达等供应商的依赖。但这并不意味着Nvidia的地位会被迅速削弱。Dylan Patel在访谈中指出,Nvidia GPU仍具有通用性优势,许多模型和开源生态本身就是围绕GPU优化的。他还提到,所谓CUDA护城河并不只是CUDA本身,而是大量下游模型和软件生态已经为英伟达硬件形态做了适配。如果模型的专家结构,隐藏维度和通信模式都更适合GPU,那么即便其他芯片具备优势,迁移也未必简单。


因此,自研芯片更像是建立第二条路线。OpenAI和Anthropic可能会继续使用GPU,TPU,Trainium等多种算力资源,同时把自研ASIC用于更明确,更稳定,更高频的工作负载,尤其是推理场景。


全行业“算力自主权”竞赛全面开启


OpenAI和Anthropic自研芯片的共同逻辑,可以概括为三点:降低长期算力成本,减少外部供应依赖,以及通过软硬件协同提升模型效率。


其中,第三点可能最关键。随着模型公司规模扩大,通用算力无法完全满足差异化架构需求。自研芯片让公司能够把模型设计,系统软件和底层硅片放在同一个优化框架内。


但方向已经清楚:大模型竞争正在从“谁的模型更强”,延伸到“谁能更好地控制算力,资金和硬件栈”。这也是OpenAI和Anthropic都走向自研芯片的真正原因。


Anthropic的探索并非孤例。从谷歌深耕十余年的TPU系列,到亚马逊专注训练场景的Trainium系列,再到Meta面向推理场景的MTIA系列,以及微软持续推进的Maia系列,头部科技公司均已在自研芯片赛道上深度布局。


对于三星而言,若能拿下Anthropic的芯片代工订单,将为其晶圆代工业务在AI领域的影响力带来重要提振。三星目前正与台积电等厂商激烈争夺先进制程客户,引入Anthropic这样具有高成长潜力的AI客户,有助于扩大其在AI半导体领域的版图。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。