xAI正式推出Grok-4与Grok-4 Heavy,其中多智能体协作版Grok-4 Heavy在高难度考试HLE(Humanity’s Last Exam)中以50.7%准确率刷新纪录。此外,Grok-4在商业模拟测试Vending-Bench中展现盈利能力,净资产表现超人类2倍。xAI同时预告8月起将陆续推出代码模型、多模态Agent及视频生成功能,加速补齐多模态短板。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。