2026-06-18 10:51

刚刚，OpenAI把Transformer作者挖走了

AppSo

速览

本文来自微信公众号： APPSO ，作者：发现明日产品的

AI圈又迎来一次标志性的人才流动。

就在刚刚，Transformer论文作者之一，知名AI研究员Noam Shazeer在社交媒体发文宣布，他将正式加入OpenAI。

他写道：

「我很兴奋地分享，我将加入OpenAI，并期待与那里出色的团队合作。

这是一个艰难的决定，决定离开。我对Google的优秀团队以及我们共同打造的一切感到无比自豪。与你们所有人共事是一种荣幸和乐趣。」

对于普通用户来说，Noam Shazeer可能不是一个高频出现的名字。但在今天的大模型行业里，他几乎站在所有关键故事的交汇处。

ChatGPT里的那个「T」，来自Transformer。而Shazeer正是2017年论文《Attention Is All You Need》的八位作者之一。

OpenAI从Google挖走的，不只是Gemini的一位负责人，也是一位亲手参与搭建现代大模型底层技术的人。

从Google早期员工，到Transformer作者

Shazeer不是近几年才冒出来的AI明星。

他2000年加入Google，是早期员工之一。最开始，他做的是搜索和广告系统相关工作，包括拼写纠错、广告文本排序、垃圾邮件检测、新闻排序等工程项目。换句话说，他在Google的前十多年，几乎涉猎了这家公司的所有核心业务。

转折发生在Google Brain。

2012年前后，Google Brain成为Google内部探索深度学习的核心团队。Shazeer从应用工程走向基础研究，也进入了后来重塑整个AI行业的技术脉络。

2017年，《Attention Is All You Need》发表。论文提出Transformer架构，用注意力机制取代过去在机器翻译中常见的循环网络和卷积网络。它带来的关键变化，是让模型训练更容易并行，规模可以继续变大，能力也开始随规模增长而显著跃迁。

此后，GPT、BERT、Claude、Gemini等大模型，都与Transformer这条技术路线有关。

在这篇论文里，Shazeer的贡献是突出的。他参与了注意力机制、多头注意力等关键设计，也亲自写过早期实现代码。后来他还提出过Mixture of Experts、Multi Query Attention、Adafactor等技术方向，许多都直接影响了今天大模型训练和推理的效率。

某种意义上，OpenAI今天能成为OpenAI，Google当年那批研究者是绕不开的源头。

他曾经离开Google，只因Google没有发布那个聊天机器人

Shazeer与Google的关系，也历经几番波折。

2018年，Google Brain研究工程师Daniel De Freitas开始做一个对话AI项目。Shazeer很快成为核心合作者。到2020年，他们做出了Meena，一个26亿参数的神经对话模型。

Meena可以闲聊、开玩笑、讨论电视节目，也能进行更复杂的对话。Google当时公开介绍过它，并称其在「合理性和特异性平均」指标上领先同类聊天机器人。

但Google没有把Meena推向公众。

原因并不难理解。聊天机器人会生成不可控内容，可能带来品牌风险、安全风险和舆论风险。Google在搜索、广告、移动系统等领域都有庞大既有业务，任何一个AI产品的失误，都会被无限放大。

Shazeer显然不满意这种谨慎。

据后来报道，他曾认为Meena有机会替代Google搜索，并创造巨大的商业价值。2021年，他和Daniel De Freitas离开Google，创立Character.AI。

后来的故事，几乎成了大模型时代最典型的AI创业样本。

Character.AI的产品很简单，也很敏锐。

用户可以和AI角色聊天。角色可以是历史人物、虚构人物、名人，也可以是用户自己创建的陪伴型角色。它没有把AI包装成效率工具，而是把AI做成了一个可以长期互动的对象。

这让Character.AI很快在消费级AI产品里获得大量用户。

2023年3月，Character.AI完成1.5亿美元A轮融资，a16z领投，估值达到10亿美元。移动应用上线后，首周下载量超过170万次。平台用户停留时长也很夸张，很多人不是问完一个问题就离开，而是把它当成聊天、陪伴、角色扮演和情绪出口。

问题也随之出现。

用户越多，推理成本越高。大模型产品的商业化并不只看流量，还要看每一次对话背后的算力账单。Character.AI虽然有高活跃用户，但收入与成本之间长期紧张。

更麻烦的是，角色聊天产品天然会触及内容安全、未成年人保护、情绪依赖等问题。对于一家创业公司来说，既要训练模型、付算力账单，又要做产品增长和安全治理，压力会越来越重。

到了2024年，Character.AI开始寻找新的出路。

Google花27亿美元，把他请了回来

2024年8月，Google与Character.AI达成协议。

表面上看，Google并没有收购Character.AI。双方签署的是非独家技术授权协议，Google可以使用Character.AI的大语言模型技术。Character.AI继续独立运营，Dominic Perella出任临时CEO，产品团队继续留下。

但外界真正关注的，是人员的流动。

Shazeer、Daniel De Freitas以及部分研究人员回到Google，加入Google DeepMind。随后，Shazeer被任命为Gemini的联合技术负责人，与Jeff Dean、Oriol Vinyals一起负责Google最重要的大模型项目。

多家媒体报道称，Google为这笔交易支付约27亿美元。而这笔钱并不只是买一份授权。更准确地说，Google用一笔极高成本，把这位曾经离开的关键人物Shazeer带回了Gemini。

如今，不到两年，故事再次转向。

Shazeer离开Gemini加入OpenAI，则让这场AI竞赛进入更微妙的阶段。毕竟，尽管大模型的技术路线仍在高速变化，但一个趋势已经很清楚：顶级研究者的稀缺性在上升。

训练更大的模型，不再只是堆GPU。推理能力、长上下文、低成本推理、模型可靠性、多模态原生能力、Agent架构，每一个方向都需要少数真正理解模型结构和训练规律的人。

Shazeer的履历刚好覆盖这些关键节点。

他懂Transformer的底层逻辑。大模型行业很多人是在使用Transformer、改造Transformer、优化Transformer，而Shazeer是最早把它做出来的人之一。

他有规模化模型经验。从Google Brain到LaMDA、Meena、Character.AI，再到Gemini，他经历过研究、产品、创业、基础模型工程和消费级应用。

他见过大公司与创业公司的两种极限。

Google的谨慎，Character.AI的增长与成本压力，Gemini的追赶任务，都让他比单纯研究者更了解大模型走向产品时会遇到什么。

OpenAI得到他，相当于得到一位从大模型史前时代一路走到今天的工程型研究者。而Transformer诞生近十年后，当年那批作者留下的影响，还在继续影响AI公司的格局。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技