扫码打开虎嗅APP
本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,题图来自:AI生成
“只有当设计那些对普通人类来说简单但对AI困难的任务变得完全不可能时,你才会知道AGI真正到来了。”
——François Chollet
1. 中国企业加入基础模型创新,扩展定律重新定义
推理模型从o1到o3的一次阶跃,仅用了3个月,而且中间还出现了两家中国公司,深度求索和阿里推出模型。2025年推理模型的竞争已经提前打响,推理侧的训练和计算,以及更集约的算法,正在重新定义下一代大模型。基础模型不再只是大规模预训练系统,而正在演变为动态的、适应性强的、自我优化的智能体。中国企业在算力约束下开辟更集约的技术路线。扩展定律(scaling law)也将重新定义并持续下去。
2. 测试AGI,基准难度增加
各种大模型的测试基准迅速饱和,那些动辄学霸级的数学、科学和编程等科目的得分,有些是数据污染带来的。顶尖数学家提出了新的数学基准FrontierMath,让包括o1在内的大模型数学得分近乎白卷。o3在ARC-AGI的得分达到了87.5。
但是,任何任务只要提供了明确的评价指标,都可以在微调过程中用作奖励信号,所有的测试基准也终将被迅速解决。ARC-AGI已经决定在2025年推出对AGI更严格的标准,而那些迅速饱和的基准版本也将被淘汰。从目前来看,人类擅长的,AI反而更难,基本解决莫拉维克悖论(Moravec’s Paradox),依然被认为是实现AGI的前提。
3. AI加快用于科学发现和企业研发
GPU的并行计算能力,最早是科学研究人员应用于他们的科研工作中的,科研总是要求更多的计算。AI推理能力在编程、数学和科学领域的突破,AI科学家获得诺贝尔化学奖,以及实例研究初步证明AI显著提升了企业研发效率,都意味着材料科学、生物科技、创新药研发等领域,将首先使用短期内成本较高的高级推理应用,更多使用AI加速研发并压缩漫长而重复的过程。越来越多的科学家将离不开AI帮助他们阅读和评议论文、产生新的思想、设计实验方案、筛选研发目标、模拟实验过程等;AI也将进一步加快进入工程设计领域。
4. Agent(智能体)更高级精密,多智能体加强协作与互动
在赋予了大模型“先验”的世界知识之后,AI正在学会感知、检索、分析、推理、规划、决策、执行,变成智能体。它能干活,陪伴和融入人类的场景之中。2025年,一些企业将会像培训员工一样构建智能体,让它们使用工具,在不同的应用和平台之间调用函数与功能,协助或独立完成任务。智能体之间还会协作,它们改写软件和服务。创造价值,AI就是智能体。
5. 推理的高token消耗,支撑算力经济持续繁荣
按照单个token计的算力成本在迅速下降,但推理的总需求却以更快的速度增加,其结果是越有价值的推理消耗越大量的token,价格越贵。目前,o3回答一个有难度的问题需要上千美元。但如果AI推理解决有经济价值的问题,能提升效率并且创造出新的需求,算力经济将会继续繁荣下去,AI芯片(GPU、ASIC、FPGA)及各种特色芯片,数据中心、云计算、数据传输,以及新型电力系统的投资将会非常巨大。科技巨头都将长期追求高性价比的算力,也会持续探索新的算法和量子计算。
6. 卷出AI搜索
微软的Bing、OpenAI的SearchGPT、独角兽Perplexity将继续挑战搜索霸主谷歌;垂直领域如法律、金融、教育、医疗等领域的大模型,都可以用作垂直AI搜索;企业AI搜索也将与智能体结合,当这些“有状态的”(stateful)搜索成为AI时代个人与企业的搜索习惯时,传统的搜索将被解构。当然,所有这些也都逃不过谷歌的掌心。也期待中国卷出更好的搜索。
7. 智能体让AI应用产生差异性,以原生和赋能的方式,在既有平台和新的领域开始产生杀手级应用
如o1解决难度高的问题,Sonnet 3.5用来编程,GPT-4o用来写文章,Gemini Flash 2.0解决长上下文问题。许多模型/代理具备了杀手级应用的潜质,如Sora,Project Astra,NotebookLM,Siri、Computer Use等,还有多模态AI加持的智能眼镜、头显等,还有豆包。美国的智能体之间有更好的连接及互操作生态,中国的应用仍然会更追求流量。
多模态、跨现实:AGI新兴智能体范式:
8. AI企业创新和应用出现中国范式
小型语言模型(SLMs)、智能体和ASIC的协同效应正在引发一场范式转变,它让中国企业的算力供应在国内和国际市场上有更多选择,也产生了更多芯片创新的机会。新范式更有利于中国企业以较高的性价比训练和微调模型。在推理模型方面,中国AI企业正在努力消弭与美国的代差,2025年会走出自己特色的大模型技术路线。分布广泛的高质量数据、相对轻量的推理模型、丰富的实体经济场景,都更有利于中国产业+AI的创新。
9. 软件公司新代码的一半先由AI生成
编程是智能体进展最快的领域,一批估值增长最快的AI初创公司,主要就是构建编程智能体。谷歌2024年新代码由AI生成已经达到25%。Claude 3.5 Sonnet模型编程能力已经超过了程序员水平的50%,2025年可望达到90%。OpenAI o3在编程能力的基准测试中已经胜过99.99%的程序员。2025年,写基础代码的工作,将会被AI加速替代。
10. 科技企业开始利用智能体精益运营
在智能体投资方面,有企业开始动用人力预算而不是IT预算。科技巨头已经开始谋划基于AI的精益管理,建立AI运营杠杆,纳德拉判断微软总人力成本会下降,而人均成本会上升,同时研究人员的人均GPU配置也会增加;黄仁勋设想英伟达拥有10万个代理,预计营收增长2~3倍,员工数量只会增加25%。salesforce创始人班尼奥夫提出AI劳动力时代。最聪明的公司都将自己构建智能体充当数字劳动力。智能体将使公司拥有无限劳动力,也可能出现少数(个)人+多智能体的初创公司。
One More Thing:物理AI
在数字领域重构3D,模拟物理世界,是GPU在游戏世界的初心,也难怪它能制造出一层又一层的神经网络。人类与万物的智能,根本上来自物理世界。制造出能与物理世界互动的机器,甚至像人一样,是人类对技术最根本的渴望。
空间计算、空间智能、空间推理、具身智能……在这些概念之上,模拟和互动物理世界的模型,可以是更好的智能体。无论是通过电脑打游戏和创作视频、借助手机理解所处的空间,还是使用XR设备如头显和眼镜,探索虚实一体的场景,都将在物理法则之上让人如临其境。自动驾驶和人形机器人,也将是人类技术在这个星球上所能制造的最具终极意义的产品。真正的智能,从来都是“具体”的。
本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究