普林斯顿大学AI Lab推出的Alita是一款革命性通用智能体,其核心理念是“最小化预定义,最大化自我进化”。与传统依赖人工预设工具库的智能体不同,Alita仅内置基础模块(管理智能体、网页智能体),却能通过动态创建MCP工具(Model Context Protocols)自主扩展能力,实现任务自适应。
在GAIA基准测试中,Alita以75.15% pass@1和87.27% pass@3的准确率超越OpenAI Deep Research等对手,成为新标杆。其关键创新在于:
自主工具生成:通过分析任务缺口,实时编写、验证并复用MCP工具,解决预定义工具库的覆盖局限;
跨模型兼容:MCP协议支持多语言工具集成,突破传统Python生态限制;
自我进化闭环:工具可被蒸馏复用,显著提升其他弱智能体性能(如GPT-4o-mini准确率提升7%)。
Alita证明,简约设计非但不制约性能,反而能激发智能体的创造力与泛化能力,为下一代通用AI开辟了新路径。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。