2025-04-11 08:29

Ironwood与A2A,谷歌AI生态的王者气象

author_path 未尽研究

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究


谁先训练出AGI,谁先合围起AI生态,足以决定大模型的未来。前者往往占据头条,但后者正在成为整个行业更紧迫的挑战。这一战已经从OpenAI宣布重新开源后正式打响,但谷歌凭借着完整的技术栈与生态,正在恢复王者气象。


今天,在谷歌云Next'25峰会上,这家科技巨头发布了搭建下一代高能效算力基础设施的Ironwood,提供高性价比推理的新一代主力模型Gemini 2.5 Flash,以及实现爆发中的智能体互操作的新标准Agent2Agent。


尽管微软搞出一些退租数据中心的小插曲,但爆款应用不时提醒着,现在仍处于算力紧缺状态。DeepSeek凭借开源的高性价比的模型,成为推动应用规模落地的重要功臣,但自身官方应用的用户体验,却又受制于算力供给规模;中国市场到处抢购一体机。在GPT-4o图片生成开放后,OpenAI的GPU都被暴涨的需求“融化了”,前两周,奥特曼还在急求,谁能邮他十万个GPU。


谷歌同样面临这样的局面。研究公司Omdia的估计,谷歌去年在TPU上的支出,在60亿至90亿美元之间。但它同时还下单了超过100亿美元的Blackwell芯片。最近,它还在寻求从CoreWeave那里租赁更多的英伟达GPU。它需要更为推理友好的AI芯片。


于是,谷歌第七代TPU(张量处理单元)Ironwood诞生了,它被称为谷歌首款专门为推理而设计(designed specifically)的AI芯片,全方位超越了不到一年前发布的Trillium。看来,谷歌的芯片团队顶住了这一年来被OpenAI挖人的压力。


推理正在朝着统一多模态与思维链的方向发展,需要完成越来越多能源与数据密集任务。除了单卡性能要足够强大外,芯片能效与内存也是升级的重要方向。Ironwood足以与去年发布的B200相媲美。单看FP8精度下的峰值算力,单个Ironwood芯片达到4,614万亿次浮点运算(TFLOPs),与B200相当(约5 PFLOPs),称得上当前最强水平。它