2026-06-02 21:02

黄仁勋口中“能赚钱的AI”，到底是什么来头？

中信出版

速览

本文来自微信公众号：中信出版，作者：阿信

昨天（6月1日），黄仁勋在英伟达GPU技术大会上发表主题演讲时称，“能赚钱的AI已经到来”。

他所说的，是近年来在人工智能领域如火如荼的代理式AI（Agentic AI）。

黄仁勋在演讲中引用GitHub的数据表示，全球约3000万到4000万专业软件开发者，总薪资约3万亿美元。在AI辅助下，这些人现在产出的工作量相当于9万亿美元的生产力。

在黄仁勋看来，与传统生成式AI相比，Agentic AI不仅能够生成内容，更能够理解任务、制定计划、调用工具并完成执行，从而创造实际商业价值。

他解释称，Agent（智能体）是一种全新的应用形态。“你可以把模型想成大脑，框架想成身体，工具是它使用的器械，运行时环境是它的车间，”黄仁勋说，“这就是一个工人在车间里使用工具工作”。

他表示，真正能够创造价值、能够采取行动的AI已经开始进入现实世界，并正在重塑各个行业。

“过去我们打开一个应用，点击、打字，”黄仁勋说，“现在我们把这些替换成向AI解释我们想要什么。AI生成代码或者使用工具，产出我们需要的结果。这就是计算机未来的工作方式，这就是Agentic AI。”

然而，在产业端，Agentic AI却呈现出某种自相矛盾的局面。

AI Council的数据显示，88%的AI Agent项目从未进入生产环境；而Anthropic联合研究机构Material刚刚发布的《2026 State of AIAgents Report》显示，80%的组织已经在AI智能体上看到了可衡量的经济回报。

88%失败，80%赚钱。两组数据指向同一个结论：Agent不是不行，是大多数人用错了方式。

问题出在哪里？要回答这个问题，需要先理解AI智能体与过去的AI系统有何本质不同。

从“能思考”到“能行动”：

一次被忽视的范式跃迁

书中用三个真实故事，揭示了当前生成式AI的致命短板。

故事一：47个浏览器标签页的度假规划噩梦

周六晚上，布莱恩打开ChatGPT，为全家规划期待已久的希腊两周游。他输入：“给我一个四口之家在希腊的行程安排。”几秒钟后，AI给出了一份精心策划的行程：“第一天至第三天：雅典，清晨前往卫城避开人群，孩子会在卫城博物馆流连忘返……在普拉卡区家庭经营酒店‘橄榄树酒馆’享用午餐，庭院里茉莉花香……还有一处‘隐秘的海滩’，畅享小众美景……”

然而，随着时间过去，布莱恩的惊叹变成了沮丧。那家令人向往的家庭经营酒店永久关闭了，所谓“隐秘的海滩”在任何地图上都找不到，烹饪课半年前就预订满了。

到晚上11点半，布莱恩的电脑桌面就像犯罪现场——47个浏览器标签页、多个航班选项的电子表格、酒店截图、旅游企业的PDF文件。AI设计的完美行程就躺在文档里，而布莱恩却花了好几个小时处理那些他以为AI会帮忙的“后勤工作”。

“我本想用一个晚上的时间畅想我们去的地方，结果却花了好几个小时做烦琐的预订工作。”布莱恩后来反思道。

世界上最先进的AI系统，能够写诗、解释量子物理学，却无法完成检查一家酒店是否仍在营业这种基本任务。它能构想出完美的假期，却连一张机票都订不了。

故事二：差点毁掉学术生涯的“聪明”AI

杰西卡博士接到父亲突发疾病的噩耗时，正在为联合国的气候峰会准备演讲。她立刻飞往新加坡，将研究收尾工作交给了团队。

“用你们需要的任何工具，”在医院里，她用匆忙的视频电话告诉团队，“只要确保一切都经过核实。”

三周后，杰西卡回到办公室审阅演讲草稿。当她询问团队如何验证其中的发现时，首席研究员汤姆打开了多个AI聊天窗口：“AI分析了我们所有的数据集，它发现了我们甚至未曾考虑过的模式。”

但当杰西卡深入核查时，她发现了可怕的事实：AI生成的有关非洲气候影响的分析中，所引用的论文根本不存在；东南亚农民适应策略的详细统计数据，与任何已知研究都不匹配。

“我们原以为自己很严谨，让AI在多个对话中交叉引用来验证。但现在我们意识到，每个对话都是独立运作的，有时甚至相互矛盾。”汤姆承认道。

此刻，距离峰会只剩48小时，杰西卡面临着艰难的决定。最终，她选择取消演讲，因为团队需要数周时间手动核实每个数据点、交叉核对每个来源、从头重建分析。

这次险些酿成大祸的经历说明：当前AI系统无法核实事实、无法保持一致性，甚至无法察觉自己生成的内容是虚假的——直到在聚光灯下被揭穿。

故事三：五个AI系统都在尖叫，却没有一个能行动

下午3点15分，玛丽亚捂着肚子来到急诊科，脸色苍白，疼痛难忍。医院的人工智能入院系统立刻启动——这是一个基于大语言模型构建的实验性聊天机器人，用于协助患者入院登记和初步评估。

通过平板电脑界面，AI在几秒钟内生成了初步评估报告：可能是她近期接受的胃旁路手术的并发症。但它无法获取15英里外中央医院的手术记录，它只能把玛丽亚的手术当作“新的信息”来处理。

下午4点，瀑布效应开始。

多个AI系统同时监测到情况恶化：生命体征监测AI发现血压在下降；实验室结果分析AI识别出内出血指标；药物管理AI标记出危险的药物相互作用；患者病史AI注意到符合术后并发症的模式。

然而，这些系统之间无法相互交流，无法自动采取任何行动。

护士詹妮弗不得不手动检查每个系统的警报，在系统之间逐条复制数据，将结果输入协调协议，亲自协调应对措施。

“我们有五个不同的人工智能系统都尖叫着指出了问题，但它们都无法实际采取任何行动。我们才是四处奔忙、试图把所有线索拼凑起来的人。”

当主治医生终于收到所有整合的信息时，玛丽亚的救治窗口已经所剩无几。医院首席医疗信息官后来调出了一组令人震惊的数据：护士和医生将高达55%的时间花在手动输入数据和系统协调上。

五个顶尖AI系统，每个都能出色地完成自己的任务，却没有能力互相沟通、协同行动。在急诊中，每一分钟都很重要，但就是如此宝贵的时间，却在AI之间的“语言不通”中消耗殆尽。

三个故事的共同点是什么？书中称之为“执行差距”：人工智能系统能够生成完美的计划，却无法在现实世界中采取行动来实施它们。它们能分析、推荐和预测，却不能执行、协调或做出适应性调整。

这正是“代理式人工智能”（Agentic AI）诞生的现实推力。

“agent”一词源自拉丁语“agere”，意思是“去做”或“去行动”。这正是Agentic AI的独特之处：与只能响应查询或生成输出的生成式人工智能系统不同，Agentic AI中的智能体可以理解目标、采取自主行动、持久保持目标，并根据现实世界的反馈调整其策略。简单地说，AI智能体是一个使用人工智能和工具来自主执行操作以实现既定目标的系统。

行动、推理与记忆

理解了从“思考”到“行动”的范式跃迁，再来看Anthropic报告的数据，就豁然开朗了。

Anthropic 2025经济指数分析了超过350万条匿名Claude对话，发现了一个关键差异：77%的商业API使用呈现自动化模式，而个人用户的比例只有50%。

这意味着，企业比个人更早完成了一个认知转换：从“我帮AI，AI帮我”的协作思维，转向了“我把活交给AI”的委派思维。那些看到回报的80%，不只是用了更好的模型，更是重新设计了工作流，把完整的任务链条交给Agent去跑。

你让一个代理人写操作手册，和跟他签授权书，是完全不同的逻辑。前者是流程，后者是信任。这个认知差，正是88%失败率的根因。

三者缺一不可。行动没有推理是蛮干，推理没有行动是空想，两者没有记忆就是一遍遍重复犯错。正如书中所写：“这些失败并非因为技术缺陷，而是未能认识到AI智能体需要三个关键要素才能有效运作。”

·L0级：手动操作——人类执行所有任务，无自动化辅助；

·L1级：基于规则的自动化——简单脚本或RPA，遵循预设规则；

·L2级：智能自动化——结合AI认知能力，但仍需大量人工监督；

·L3级：智能体工作流——能生成内容、规划、推理和适应；

·L4级：半自主智能体——在限定专业领域内自主工作并学习；

·L5级：全自主智能体——理论巅峰，跨领域自主学习。

书中明确指出，目前市场上大多数AI智能体仍处于L2向L3跨越的阶段，而L5级智能体仍是终极目标。

L2到L3的鸿沟在哪里？L2的智能体仍然在相当严格的参数范围内运行，需要大量人工监督，就像一辆能保持在机动车道内但仍需人类随时接管的汽车，而L3的智能体能够在预定义的边界内适应环境变化，具备一定的规划、推理和记忆能力，就像能在高速公路上独立行驶但在复杂情况下需要人类接管的车辆。

从L2跨到L3，需要的不只是更好的模型，而是从“工具思维”到“代理思维”的转换。

不是所有场景都需要Agent

这是否意味着，在一切工作场景下，我们对人工智能的需求都将向Agentic AI发展？

书中强调，选择合适的级别是成功实施的关键。不是所有场景都值得做Agent。有些事交给规则引擎就够了，有些事交给大模型单次调用就够了，只有那些需要“持续自主决策”的场景，才真正需要代理式AI。

88%的失败率和80%的回报率，看似矛盾，其实说的是同一件事：Agent正在从实验走向基础设施，但这条路只对完成了认知转换的人敞开。

许多企业盲目智能化，引发员工大范围的焦虑和辞职，AI智能体做出未经授权的决策导致声誉受损，其提出的行动建议违背企业价值观。这些草率的部署，最终都以代价高昂的失败告终。但那些经过了审慎决策并认真推行Agentic AI的企业，获得了无法想象的效率和效益提升。

在Agent从概念走向生产的拐点上，理解代理式AI，绝不只是“赶风口”这么简单。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI创投日报

频道：前沿科技