阿里通义实验室深夜开源高性能Web Agent模型WebSailor,突破开源Agent在复杂任务上的性能瓶颈。该模型通过三大创新点实现SOTA表现:1)构建L3级合成数据集SailorFog-QA,采用知识图谱随机游走和模糊化处理生成高不确定性任务;2)提炼专家模型轨迹精华,去除冗余信息保留核心推理逻辑;3)独创DUPO强化学习算法,训练效率提升2-3倍。在BrowseComp等高难度评测中,WebSailor首次证明开源Agent可媲美闭源系统。项目同步开源32B参数模型、代码及1.2万条高质量训练数据,为AI智能体发展提供重要基础设施。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。