2026-06-05 19:43

腾讯姚顺雨对谈腾讯汤道生：我们真的慢了吗？

速览

本文来自微信公众号：未来图灵，作者：张凤静

在6月5日举行的2026腾讯云AI产业应用大会现场，所有人的目光都聚焦在台上两个人身上——腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生，和坐在他身旁、略显拘谨的年轻人。

这个年轻人就是姚顺雨，被外界称为“腾讯史上最年轻的核心部门掌舵者”，腾讯首席AI科学家、混元大模型及AI Infra负责人。他身上有太多标签：ReAct架构提出者、前OpenAI研究员、普林斯顿大学博士、清华“姚班”出身。2025年12月17日加入腾讯后，外界对他的好奇和质疑从未停止：为什么选择腾讯？腾讯在AI上是不是慢了？混元大模型到底能不能打？

这是姚顺雨加入腾讯后的第二次公开亮相，也是他首次线下真身出现在公众面前。

这一次，姚顺雨没有“回避”任何问题。他与汤道生进行了一场近一小时的开放对谈，主题是《腾讯AI下半场》。两个人在台上互相提问、互相作答。我们把这场对话切开、重组，试图拼出一张腾讯AI的真实地图。

万能“锤子”与找“钉子”的哲学

对谈刚开始，汤道生直接开门见山的就抛出了那个所有人最关心的问题：“你为什么下半场会选择来腾讯？”

姚顺雨没有马上回答，而是先厘清了一个被“用滥了”的概念——AI下半场。这个概念源自他去年的一篇博客。在他看来，AI上半场的主题是“找方法”：为了下围棋，发明AlphaGo；为了做翻译，训练专门的翻译模型。每个任务都需要定制化的技术方案，就像为每一种钉子单独打造一把锤子。

但预训练和后训练的成熟，改变了这一切。“我们现在好像有了一把万能锤子，它可以去砸任何钉子。”姚顺雨说，“它是一个通用方法论，可以解决各种各样的问题，反而更困难的是怎么寻找好的问题去解决。”

这就是他选择腾讯的第一个理由。这里有海量的“好钉子”。微信、QQ、腾讯会议、企业微信、元宝……这些国民级产品每天都在产生真实的使用场景和交互数据。在姚顺雨的词典里，这些场景和数据共同构成了一个关键的词：Context（上下文）。

“模型越来越擅长把一个非常复杂的输入变成输出。你的竞争壁垒就在于，你有没有最原始的输入，你到底知不知道这个人在干什么？知不知道这个企业各种各样的信息？”他认为，腾讯在这方面拥有非常强的优势。

但这只是第二重要的原因。最重要的原因，是文化。

姚顺雨回忆起第一次与汤道生和总办其他成员聊天的场景，印象最深的不是技术愿景，不是资源承诺，而是一种罕见的坦诚。“大家做得好、做得不好都非常实在，不会去掩盖。我知道这里做好了，我知道那里没做好，我知道应该怎么做。”他说，“腾讯总体是一个基于信任、而不是基于指标来运转的公司。我们的文化里有非常低的low ego，有非常solid的一面。这些东西对于长期做AI的组织来说，太重要了。”

在他看来，AI下半场的核心目标，不是造出一个超级应用，而是在中国建立一个长期主义的、可持续积累的AGI组织。他把这个组织画成一个“均衡三角形”：底层是Foundation（基础模型），把预训练和后训练做到极致；中间是Product（产品），让技术真正产生社会价值；顶层是Frontier（前沿探索），不断寻找新的研究范式和机会。

图注：该图片由豆包AI生成

“只做好其中一块不够，必须三块均衡发展。”他说。而支撑这个三角形的，正是他感受到的那种文化——不追短期风口，不粉饰问题，愿意为长期价值承受暂时的误解。

汤道生在一旁补充道，这种务实坦诚的氛围，也是他经常从客户那里得到的反馈。“我们做的好的和不好的都得认。AI赛道是长跑，认知很重要。这是一个多维度的竞赛。”

比刷榜更重要的，是学会“换位思考”

如果说“三角形”是腾讯AI的骨架，那么Co-Design（协同设计）就是连接骨架的韧带。

汤道生提了一个很实在的问题：腾讯有这么多产品，从元宝这样的聊天机器人，到CodeBuddy、WorkBuddy这样的效率智能体，都深度依赖模型能力。怎么把模型和产品真正结合在一起？

姚顺雨的回答直指一个中国AI行业的普遍问题：“中国大家有个不好的倾向，就是喜欢刷榜。”

虽然这句话说得很轻，但分量不轻。他解释，Benchmark（基准）并非完全没有价值，但问题在于很多公开榜单容易被“过拟合”。榜单上的题目通常是描述精确、边界清晰的单轮问题，但真实用户的使用场景完全不同——问题模糊、多轮追问、充满歧义。

腾讯的选择是：把评价体系从“榜单导向”拉回到“真实场景导向”。混元大模型的Preview版本，最重要的目的之一就是获取真实世界反馈，去发现那些榜单上永远不会出现的“底线问题”。

他讲了一个很少有人注意到的细节。在混元自己的预训练还没有完全准备好时，他就做出了一项让很多算法同学不理解的决策——派出后训练最强的骨干力量，优先帮元宝把后训练做好。

“维护好元宝这样的产品以及它的DAU，对我们接下来做模型非常非常重要。”姚顺雨说，“当时很多算法同学不理解，我需要很努力地去解释。但现在回头看，这个动作让产品团队意识到，模型的同学是真的在为他们着想。包括Hy3 preview在元宝上成功上线起到了非常重要的作用。”

这引出了Co-Design中最核心也最难的一点：建立信任。因为做模型的人和做产品的人，天然存在目标上的张力。模型团队追求能力越强越好，产品团队追求用户需求被满足。姚顺雨认为，最难的不是技术细节，而是“换位思考的能力”，是彼此愿意为了共同目标做出短期“牺牲”。

汤道生从产品视角印证了这一点。他把传统产品比作“预制菜”：用户只能在固定的菜单里选择。但在AI时代，自然语言成了主交互界面，产品方永远不知道用户下一句会问什么。这就要求产品的所有设计：评测、对齐、工具调用都要前置，和模型训练融为一体。

汤道生认为“以前瀑布式的研发流程很清晰，需求、设计、开发、测试，一步一步来。但今天大部分代码都是AI生成的，工程师更多在做架构设计，把写代码的工作交给AI，定期指导、修正。测试也要左移，更前置地想清楚评测标准和用户风格的对齐。”汤道生说，“今天做产品要求的能力更全面。”姚顺雨紧接着回答：“更难了。”

而混元3本身的技术升级，也顺着这套逻辑展开。姚顺雨把它总结为三件事：一是重建了预训练和强化学习基础设施。二是对数据做了很大改变，包括定义更真实的问题、丰富data taxonomy等。三是许多关键决策没有清晰公式，需要在招人、模型节奏、资源取舍中不断做trade-off。

慢慢来，比较快

这场对话进行到中后段，汤道生把那个最尖锐的问题摆上了台面：“很多人都说，腾讯在AI上没有及时抓住一些机会。你觉得我们真的慢了吗？”

姚顺雨没有急着辩解，而是回到了两个更底层的判断。

第一个判断：AI是一场短期游戏，还是一场长期游戏？他说，硅谷现在弥漫着一种焦虑情绪:两年后所有人都会失业，我们要赶快赚两年钱然后退休。但腾讯的判断很明确，这是一个刚刚开始的长期游戏。“我不认为ChatGPT和Claude Code会是唯一的Super App，那是一个非常灰暗的世界。肯定还会有源源不断的新机会诞生。今天就像70年代PC刚刚产生的时候，还有很多很多事情需要做。”

第二个判断：AI的未来是线性单一路径，还是多元生态？过去几年，行业似乎有一条清晰的主线：Pre-training、post training、Agent、Coding Agent，所有人都在做一样的事，都在Copy。但在姚顺雨看来，这同样是“非常灰暗”的图景。“我的个人看法是，未来会变得更多元。Coding Agent的生产力革命才刚刚开始，这个世界还有很多空间没有被填满。多模态、具身智能，很多新的事情正在发生。”

基于这两个判断，他给出了一个学者式的回应：“过去模型、产品上做了很多探索，走过弯路。这是正常的，没做过的事情第一次做，肯定有曲折。但更重要的事情是说能不能诚实面对自己，能不能Be Real，能不能看到feedback（反馈）然后改变，能不能保持耐心。这才是下半场最重要的事。”

汤道生接过话题，坦然承认腾讯是一个多业态、多赛道的复杂公司，不同业务线的进度本来就有快有慢，也会有失败和反复。“这些提醒都非常好，有些地方我们确实可以做得更好。但就像你说的，这是长跑，是马拉松。”他特别提到，腾讯多年积累的全产品线场景数据，是这场长跑中最大的护城河。

图注：OpenRouter模型调用周榜，5月7日

姚顺雨特别强调了一个关于“性价比”的认知误区。很多人以为降本关键是模型架构压缩，但他认为真正的核心首先在于性能本身。“如果性能不好，性价比就很难成立。用更好的模型一次把事情做对，比用更差的模型反复试错省钱得多。把相对简单的任务一次性做对、做到足够robustness(鲁棒)，这可能在很多长程的上面提升一两个点的提升。”在此基础上，用更小的模型去完成更高价值的任务，才是适合中国市场的务实路径。

汤道生补充了来自组织层面的观察。他注意到，WorkBuddy等新产品的团队呈现出完全不同的组织形态：不是传统的多层级架构，而是三五个人一个小组，围绕某个特定方向快速试验、验证。大部分试验拿不到正向反馈，但公司需要包容这种试错。“原来的工程师大量时间花在写代码上，现在这些工作可以交给AI了。每个工程师更像一个有想法的leader，同时驱动多个Coding Agent干活，还要参与评测、测试，把对齐工作做到前面来。”

一个28岁年轻人的“慢选择”

对谈过程中，姚顺雨回忆起一个令他感慨的瞬间。前几天他重新翻看了自己2019年的博士论文，标题是《Language Agents:From Next-Token Prediction to Digital Automation》。那时候还是Literally也就是我们的GPT-2，模型生成的文本经常不连贯，没人能想到它会成为改变世界的力量。

但他当时在论文结尾写下的“future work（未来工作）”，第一条就是“train models for Agent（为Agent训练模型）”。七年后，他真的在做这件事。

他描述起2022年7月的某个夜晚，他第一次把PaLM 2的API和当时手写的一个Wikipedia API连在一起，看到模型能够基于互联网进行多轮交互时，那种感觉“就像微弱的电灯丝突然亮了一下”。当时他隐约觉得，这东西可能会在五到十年内改变世界。但后来发生的一切，比他想象中还要快。

小编突然意识到，姚顺雨看腾讯AI的视角，本质上就是这个比喻的延伸。他不迷信点燃镁光灯式的爆发，更相信那根微弱灯丝持续通电、缓慢点亮整个房间的过程。在一个急切追求“快”的时代，这位28岁的年轻人选择了一家愿意让他“诚实面对问题、慢慢做对事情”的公司。也许，这才是姚顺雨视角下的腾讯AI最真实的模样：不完美，但足够诚实；不激进，但准备好跑一场长跑。

“可能我想的还是不够大。”他笑着说。

腾讯AI能跑多快，或许还需要时间给出答案。但至少在这场对话里，外界看到了一个不再急于自证、而是选择诚实面对自己的腾讯。它把AI定义成一场数十年的长跑，把场景和上下文看作最深的壁垒，把信任和换位思考视作比技术更难也更有价值的事。

慢慢来，有时候反而比较快。

Be Real，在AI下半场，这或许是一种比速度更稀缺的能力。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI创投日报

频道：前沿科技