扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2025-06-15 23:41

让Agent自己认错论文斩获ICML

宾夕法尼亚州立大学、杜克大学与谷歌DeepMind等机构联合发表ICML 2025 Spotlight论文,首创「自动化失败归因」方法,解决多智能体AI系统的故障溯源难题。研究团队发布首个专用数据集Who&When,包含127个多智能体系统的精细标注失败案例(责任Agent、错误步骤及原因),并测试三种归因方法:全局审视法(53.5%责任识别准确率)、逐步侦查法(擅长定位错误步骤)和二分定位法。实验显示,即便GPT-4o等SOTA模型表现仍不理想(错误步骤定位准确率仅14.2%),凸显任务复杂性。该研究为提升多智能体系统可靠性提供关键工具,相关代码与数据已开源。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: