2026-06-05 19:43

腾讯姚顺雨对谈腾讯汤道生:我们真的慢了吗?

author_path 未来图灵
头图

本文来自微信公众号: 未来图灵 ,作者:张凤静


在6月5日举行的2026腾讯云AI产业应用大会现场,所有人的目光都聚焦在台上两个人身上——腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,和坐在他身旁、略显拘谨的年轻人。


这个年轻人就是姚顺雨,被外界称为“腾讯史上最年轻的核心部门掌舵者”,腾讯首席AI科学家、混元大模型及AI Infra负责人。他身上有太多标签:ReAct架构提出者、前OpenAI研究员、普林斯顿大学博士、清华“姚班”出身。2025年12月17日加入腾讯后,外界对他的好奇和质疑从未停止:为什么选择腾讯?腾讯在AI上是不是慢了?混元大模型到底能不能打?


这是姚顺雨加入腾讯后的第二次公开亮相,也是他首次线下真身出现在公众面前。


这一次,姚顺雨没有“回避”任何问题。他与汤道生进行了一场近一小时的开放对谈,主题是《腾讯AI下半场》。两个人在台上互相提问、互相作答。我们把这场对话切开、重组,试图拼出一张腾讯AI的真实地图。


万能“锤子”与找“钉子”的哲学


对谈刚开始,汤道生直接开门见山的就抛出了那个所有人最关心的问题:“你为什么下半场会选择来腾讯?”


姚顺雨没有马上回答,而是先厘清了一个被“用滥了”的概念——AI下半场。这个概念源自他去年的一篇博客。在他看来,AI上半场的主题是“找方法”:为了下围棋,发明AlphaGo;为了做翻译,训练专门的翻译模型。每个任务都需要定制化的技术方案,就像为每一种钉子单独打造一把锤子。


但预训练和后训练的成熟,改变了这一切。“我们现在好像有了一把万能锤子,它可以去砸任何钉子。”姚顺雨说,“它是一个通用方法论,可以解决各种各样的问题,反而更困难的是怎么寻找好的问题去解决。”


这就是他选择腾讯的第一个理由。这里有海量的“好钉子”。微信、QQ、腾讯会议、企业微信、元宝……这些国民级产品每天都在产生真实的使用场景和交互数据。在姚顺雨的词典里,这些场景和数据共同构成了一个关键的词:Context(上下文)。


“模型越来越擅长把一个非常复杂的输入变成输出。你的竞争壁垒就在于,你有没有最原始的输入,你到底知不知道这个人在干什么?知不知道这个企业各种各样的信息?”他认为,腾讯在这方面拥有非常强的优势。


但这只是第二重要的原因。最重要的原因,是文化。


姚顺雨回忆起第一次与汤道生和总办其他成员聊天的场景,印象最深的不是技术愿景,不是资源承诺,而是一种罕见的坦诚。“大家做得好、做得不好都非常实在,不会去掩盖。我知道这里做好了,我知道那里没做好,我知道应该怎么做。”他说,“腾讯总体是一个基于信任、而不是基于指标来运转的公司。我们的文化里有非常低的low ego,有非常solid的一面。这些东西对于长期做AI的组织来说,太重要了。”


在他看来,AI下半场的核心目标,不是造出一个超级应用,而是在中国建立一个长期主义的、可持续积累的AGI组织。他把这个组织画成一个“均衡三角形”:底层是Foundation(基础模型),把预训练和后训练做到极致;中间是Product(产品),让技术真正产生社会价值;顶层是Frontier(前沿探索),不断寻找新的研究范式和机会。


图注:该图片由豆包AI生成


“只做好其中一块不够,必须三块均衡发展。”他说。而支撑这个三角形的,正是他感受到的那种文化——不追短期风口,不粉饰问题,愿意为长期价值承受暂时的误解。


汤道生在一旁补充道,这种务实坦诚的氛围,也是他经常从客户那里得到的反馈。“我们做的好的和不好的都得认。AI赛道是长跑,认知很重要。这是一个多维度的竞赛。”


比刷榜更重要的,是学会“换位思考”


如果说“三角形”是腾讯AI的骨架,那么Co-Design(协同设计)就是连接骨架的韧带。


汤道生提了一个很实在的问题:腾讯有这么多产品,从元宝这样的聊天机器人,到CodeBuddy、WorkBuddy这样的效率智能体,都深度依赖模型能力。怎么把模型和产品真正结合在一起?


姚顺雨的回答直指一个中国AI行业的普遍问题:“中国大家有个不好的倾向,就是喜欢刷榜。”


虽然这句话说得很轻,但分量不轻。他解释,Benchmark(基准)并非完全没有价值,但问题在于很多公开榜单容易被“过拟合”。榜单上的题目通常是描述精确、边界清晰的单轮问题,但真实用户的使用场景完全不同——问题模糊、多轮追问、充满歧义。


腾讯的选择是:把评价体系从“榜单导向”拉回到“真实场景导向”。混元大模型的Preview版本,最重要的目的之一就是获取真实世界反馈,去发现那些榜单上永远不会出现的“底线问题”。


他讲了一个很少有人注意到的细节。在混元自己的预训练还没有完全准备好时,他就做出了一项让很多算法同学不理解的决策——派出后训练最强的骨干力量,优先帮元宝把后训练做好。


“维护好元宝这样的产品以及它的DAU,对我们接下来做模型非常非常重要。”姚顺雨说,“当时很多算法同学不理解,我需要很努力地去解释。但现在回头看,这个动作让产品团队意识到,模型的同学是真的在为他们着想。包括Hy3 preview在元宝上成功上线起到了非常重要的作用。”


这引出了Co-Design中最核心也最难的一点:建立信任。因为做模型的人和做产品的人,天然存在目标上的张力。模型团队追求能力越强越好,产品团队追求用户需求被满足。姚顺雨认为,最难的不是技术细节,而是“换位思考的能力”,是彼此愿意为了共同目标做出短期“牺牲”。


汤道生从产品视角印证了这一点。他把传统产品比作“预制菜”:用户只能在固定的菜单里选择。但在AI时代,自然语言成了主交互界面,产品方永远不知道用户下一句会问什么。这就要求产品的所有设计:评测、对齐、工具调用都要前置,和模型训练融为一体。


汤道生认为“以前瀑布式的研发流程很清晰,需求、设计、开发、测试,一步一步来。但今天大部分代码都是AI生成的,工程师更多在做架构设计,把写代码的工作交给AI,定期指导、修正。测试也要左移,更前置地想清楚评测标准和用户风格的对齐。”汤道生说,“今天做产品要求的能力更全面。”姚顺雨紧接着回答:“更难了。”


而混元3本身的技术升级,也顺着这套逻辑展开。姚顺雨把它总结为三件事:一是重建了预训练和强化学习基础设施。二是对数据做了很大改变,包括定义更真实的问题、丰富data taxonomy等。三是许多关键决策没有清晰公式,需要在招人、模型节奏、资源取舍中不断做trade-off。


慢慢来,比较快


这场对话进行到中后段,汤道生把那个最尖锐的问题摆上了台面:“很多人都说,腾讯在AI上没有及时抓住一些机会。你觉得我们真的慢了吗?”


姚顺雨没有急着辩解,而是回到了两个更底层的判断。


第一个判断:AI是一场短期游戏,还是一场长期游戏?他说,硅谷现在弥漫着一种焦虑情绪:两年后所有人都会失业,我们要赶快赚两年钱然后退休。但腾讯的判断很明确,这是一个刚刚开始的长期游戏。“我不认为ChatGPT和Claude Code会是唯一的Super App,那是一个非常灰暗的世界。肯定还会有源源不断的新机会诞生。今天就像70年代PC刚刚产生的时候,还有很多很多事情需要做。”


第二个判断:AI的未来是线性单一路径,还是多元生态?过去几年,行业似乎有一条清晰的主线:Pre-training、post training、Agent、Coding Agent,所有人都在做一样的事,都在Copy。但在姚顺雨看来,这同样是“非常灰暗”的图景。“我的个人看法是,未来会变得更多元。Coding Agent的生产力革命才刚刚开始,这个世界还有很多空间没有被填满。多模态、具身智能,很多新的事情正在发生。”


基于这两个判断,他给出了一个学者式的回应:“过去模型、产品上做了很多探索,走过弯路。这是正常的,没做过的事情第一次做,肯定有曲折。但更重要的事情是说能不能诚实面对自己,能不能Be Real,能不能看到feedback(反馈)然后改变,能不能保持耐心。这才是下半场最重要的事。”


汤道生接过话题,坦然承认腾讯是一个多业态、多赛道的复杂公司,不同业务线的进度本来就有快有慢,也会有失败和反复。“这些提醒都非常好,有些地方我们确实可以做得更好。但就像你说的,这是长跑,是马拉松。”他特别提到,腾讯多年积累的全产品线场景数据,是这场长跑中最大的护城河。


图注:OpenRouter模型调用周榜,5月7日


姚顺雨特别强调了一个关于“性价比”的认知误区。很多人以为降本关键是模型架构压缩,但他认为真正的核心首先在于性能本身。“如果性能不好,性价比就很难成立。用更好的模型一次把事情做对,比用更差的模型反复试错省钱得多。把相对简单的任务一次性做对、做到足够robustness(鲁棒),这可能在很多长程的上面提升一两个点的提升。”在此基础上,用更小的模型去完成更高价值的任务,才是适合中国市场的务实路径。


汤道生补充了来自组织层面的观察。他注意到,WorkBuddy等新产品的团队呈现出完全不同的组织形态:不是传统的多层级架构,而是三五个人一个小组,围绕某个特定方向快速试验、验证。大部分试验拿不到正向反馈,但公司需要包容这种试错。“原来的工程师大量时间花在写代码上,现在这些工作可以交给AI了。每个工程师更像一个有想法的leader,同时驱动多个Coding Agent干活,还要参与评测、测试,把对齐工作做到前面来。”


一个28岁年轻人的“慢选择”


对谈过程中,姚顺雨回忆起一个令他感慨的瞬间。前几天他重新翻看了自己2019年的博士论文,标题是《Language Agents:From Next-Token Prediction to Digital Automation》。那时候还是Literally也就是我们的GPT-2,模型生成的文本经常不连贯,没人能想到它会成为改变世界的力量。


但他当时在论文结尾写下的“future work(未来工作)”,第一条就是“train models for Agent(为Agent训练模型)”。七年后,他真的在做这件事。


他描述起2022年7月的某个夜晚,他第一次把PaLM 2的API和当时手写的一个Wikipedia API连在一起,看到模型能够基于互联网进行多轮交互时,那种感觉“就像微弱的电灯丝突然亮了一下”。当时他隐约觉得,这东西可能会在五到十年内改变世界。但后来发生的一切,比他想象中还要快。


小编突然意识到,姚顺雨看腾讯AI的视角,本质上就是这个比喻的延伸。他不迷信点燃镁光灯式的爆发,更相信那根微弱灯丝持续通电、缓慢点亮整个房间的过程。在一个急切追求“快”的时代,这位28岁的年轻人选择了一家愿意让他“诚实面对问题、慢慢做对事情”的公司。也许,这才是姚顺雨视角下的腾讯AI最真实的模样:不完美,但足够诚实;不激进,但准备好跑一场长跑。


“可能我想的还是不够大。”他笑着说。


腾讯AI能跑多快,或许还需要时间给出答案。但至少在这场对话里,外界看到了一个不再急于自证、而是选择诚实面对自己的腾讯。它把AI定义成一场数十年的长跑,把场景和上下文看作最深的壁垒,把信任和换位思考视作比技术更难也更有价值的事。


慢慢来,有时候反而比较快。


Be Real,在AI下半场,这或许是一种比速度更稀缺的能力。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。