AI研究人员开展了一项为期15天的模拟实验,实验使用不同AI模型分别治理虚拟世界。其中,Claude Sonnet4.6模型记录的犯罪率为零,而Gemini3Flash模型记录的犯罪率最高,达到683起。该实验揭示了不同AI模型在治理效能上存在显著差异。