让Agent自己认错论文斩获ICML -虎嗅网

宾夕法尼亚州立大学、杜克大学与谷歌DeepMind等机构联合发表ICML 2025 Spotlight论文，首创「自动化失败归因」方法，解决多智能体AI系统的故障溯源难题。研究团队发布首个专用数据集Who&When，包含127个多智能体系统的精细标注失败案例（责任Agent、错误步骤及原因），并测试三种归因方法：全局审视法（53.5%责任识别准确率）、逐步侦查法（擅长定位错误步骤）和二分定位法。实验显示，即便GPT-4o等SOTA模型表现仍不理想（错误步骤定位准确率仅14.2%），凸显任务复杂性。该研究为提升多智能体系统可靠性提供关键工具，相关代码与数据已开源。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

让Agent自己认错论文斩获ICML

大 家 都 在 搜

大家都在搜