扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2025-07-15 09:36

XmasterHLE最强开源多智能体框架

上海交通大学AI学院发布的X-Masters开源智能体系统在全球顶级科学基准测试"人类最后大考"(HLE)中以32.1%的准确率刷新纪录,成为首个突破30%大关的AI系统,超越OpenAI(26.6%)和Google(26.9%)。其核心创新包括:

X-Master智能体:通过生成Python代码调用工具(如网络搜索、科学计算),模仿人类"思考-工具交互-反馈"的推理流程;

多智能体协作工作流:采用"分散-堆叠"架构,由5组智能体并行生成、批判、重写方案,最终融合最优解,性能较基础模型提升81%。

在生物医学领域,X-Masters同样以27.6%的准确率领先专业AI系统。研究团队强调,该成果证明开源社区可通过精巧架构设计超越闭源巨头,为通用科学AI发展提供新范式。项目代码已公开,未来将扩展至更多科学领域。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: