扫码打开虎嗅APP
本文来自微信公众号: 集智俱乐部 ,作者:任筱芃
一个没有编剧的情景
如果让一群AI在虚拟小镇里自由生活2天,会发生什么?斯坦福的研究者搭建了一个沙盒环境——Smallville,放进25个智能体,每个只有一段简短的自然语言描述作为初始设定。药剂师John Lin热心肠,妻子是大学教授,儿子学音乐理论;咖啡馆老板Isabella Rodriguez热爱社交,正在筹备一场情人节派对。
但Smallville的关键不在于这些设定,而在于它所构建的运行方式。它不仅仅是一个“类似《模拟人生》”的系统,也是一个完整的游戏沙盒。在空间结构和用户干预方式上都是一座游戏沙盒。用户可以扮演“记者”与角色对话、扮演“内心声音”下达指令、或直接修改环境状态——这与玩家在沙盒游戏中与游戏世界交互的方式形成了对应。
没有剧本,没有行为树,没有强化学习的奖励函数。每个角色只是一台GPT-3.5,加上一个记录所有经历的记忆流(Memory Stream)、一个从中提炼抽象认知的反思机制(Reflection)以及一个自顶向下逐层细化的规划器(Planning)。这就是架构的全部。

图:药剂师John Lin的一天。John早上6点起床,完成刷牙、洗澡、吃早餐等晨间活动,随后前往药房工作。午后与邻居闲聊,晚间与家人共度时光。智能体从初始设定出发,自发构建了一条连贯的日常作息。(原图Figure 3)
2天后,出现了一系列意料之外的社会行为。Sam Moore竞选镇长的小道消息从一个人传到了八个人;Isabella的情人节派对邀请扩散到了十三人,5人准时赴约,其中Maria还鼓起勇气约了暗恋对象Klaus一同前往。社交网络的密度从0.167跃升到0.74——而这些举动没有一个来自用户指令。
由此可以回到论文的核心问题,即什么样的架构能让大语言模型产生可信的、长期连贯的人类行为模拟?答案是记忆、反思和规划的协同——三者各贡献了独立可测量的行为可信度增益。但这引出了一个更深层的问题,即在游戏设计中,NPC的行为由行为树或有限状态机预定义——每个动作都有对应的触发条件。Smallville的智能体没有这样的脚本。它们的行为不是执行预设指令,而是从个体的经历积累和前瞻计划中自发生成。当一个存在者不被脚本约束,而是拥有自主的记忆体系和规划能力时,它的行为还能被称作“模拟”吗?还是已经变成了某种“玩”?在本文的框架中,“模拟”指的是系统在规则约束下生成行为,“玩”指的是行为主体在动态规则中自发行动——两者的分界线在于是否有预设脚本约束具体行为。后文将区分三个层面来回答这个问题:
人类玩家有赌注(或附带机会成本)、有张力的体验性玩;
系统在规则约束下产生设计者未预期行为的类玩涌现;
以及观察者将系统行为解读为“像在玩”的解释性投射。
Smallville的智能体在哪一层?这是本文的核心问题。
创造可信的虚拟角色——即行为兼具一致性、连贯性与不可预测性的角色——是交互计算和游戏领域延续40年的目标(Park et al.,2023)。从《模拟人生》到认知模型GOMS——一种将用户操作分解为目标、方法和选择规则的建模方法(Card,Moran&Newell,1983),研究者和开发者一直希望AI角色能像真实人类一样行动。问题在于如何实现。
第一条路,规则驱动:有限状态机和行为树仍是游戏工业的主流(McCoy,Mateas&Wardrip-Fruin,2009)——《模拟人生》中的Sim按阈值触发行为,穷举所有交互不现实,角色无法产生脚本之外的行为。
第二条路,强化学习:在竞技游戏中击败了人类职业选手(Vinyals et al.,2019),但它依赖明确的奖励信号——社交场景没有胜负条件。
第三条路,认知架构(SOAR、ACT-R)维护记忆并按“感知-规划-行动”循环运行,但行动空间受限于手工编写的程序性知识(Laird,2012;Newell,1990)。
第四条路,大语言模型:编码了海量人类行为模式(Brown et al.,2020),但单独使用时没有跨时间步的持续记忆,无法从经验中学习和归纳——没有规划器时,智能体可能在12点吃午饭,12:30和下午1点再吃两次,因为它不知道自己已经吃过了。
四条路各自碰壁,问题卡在“行为生成”与“记忆和规划”的分离上——前三条路无法生成开放行为,第四条路无法管理时间。
生成式智能体(Generative Agents)是将两者结合。大语言模型提供行为生成的能力,一套认知架构管理记忆、提取洞察、驱动规划。下文展开这一架构。
生成式智能体架构由4个相互连接的模块组成,以自然语言为统一表示——智能体的经历、思想、计划全部用自然语言记录和推理,不依赖任何预定义的符号系统或知识图谱。该系统使用GPT-3.5-turbo作为底层模型。

图:生成式智能体架构概览。智能体感知环境,所有感知存入记忆流(Memory Stream);架构检索相关记忆以决定行动,并用于形成长期计划(Planning)和高层次反思(Reflection),三者均回写入记忆流。(原图Figure 5)
记忆流是整个架构的基础设施,记录智能体的全部经历。每条记忆是一个自然语言描述,附带创建时间戳和最近访问时间戳。最基本的记忆单元是观察(Observation)——智能体感知到的事件,如“Isabella正在做早餐”。对话被分别从每个参与者的视角记录为独立的观察。

图:记忆流示例。记忆流包含大量观察记录,其中部分与智能体当前情境相关、部分无关。检索函数通过三维加权筛选出最相关的记忆纳入提示词。(原图Figure 6)
系统首先解决的问题是智能体如何保留过去?记忆流在游戏引擎中有直接对应物——游戏状态。但有一个关键区别。游戏状态是机器可读的结构化数据,而记忆流是自然语言。结构化状态的加载是确定性的——同样的存档文件总是恢复到同样的游戏状态;自然语言状态的“加载”(即检索)则是概率性的——智能体调取哪些记忆、如何理解这些记忆,取决于检索函数的三维加权和语言模型的当次推理。这意味着智能体对自身经历的“回忆”天然带有选择性和重构性。这个设计直接利用了大语言模型处理自然语言的能力,但也埋下了后来“装饰性幻觉”的隐患。当世界知识和角色记忆混在同一池自然语言中,两者之间的边界注定是模糊的。所谓“语义开放”建立在具体的工程约束上——提示词模板、检索权重、上下文窗口、采样温度全都在限制输出。自然语言没有获得本体论上的解放,只是从确定性控制转向了统计性控制。2天模拟结束时,25个智能体积累了大量记忆记录。
但仅仅“记录过去”并不足以构成行为。如果所有记忆都被等价存储,系统将无法判断什么是当前相关信息。当角色需要回应某个情境时,系统通过3个维度筛选最相关的记忆,体现为时近性(最近的记忆权重更高,随时间指数衰减)、重要性(GPT-3.5在1~10分范围内为每条记忆打分,“打扫房间”得2分,“约暗恋对象出去”得8分)和相关性(基于语义相似度匹配当前情境)。三个维度的分数归一化后综合排名,选出可纳入上下文窗口的高排名记忆。当维度冲突——例如一条高度重要但时间久远的记忆——归一化后的加权求和给出最终排名。检索失败是最常见的错误来源,因此这个设计是整个架构行为质量的关键保障。
检索解决了“找什么”,但没有解决“从找到的东西中能提炼什么”。仅有观察级记忆的智能体无法做出需要归纳推理的决策——例如,Klaus只能选择每天碰面最多的邻居Wolfgang作为“想共度一小时的人”,而非真正有共同兴趣的Maria。反思机制补上了这一环。当最近经历的事件重要性分数累积超过阈值(约150分),系统启动反思流程——从最近100条记忆中生成3个高阶问题,对每个问题检索相关记忆后生成洞察,再由语言模型压缩为更高层次的陈述。例如从"Klaus在图书馆阅读一本关于绅士化的书"和"Klaus与图书管理员讨论了他的研究项目"中归纳出"Klaus对绅士化研究高度投入"。反思不仅可以基于观察,还可以基于之前的反思——智能体构建出反思树,从观察到洞察,从洞察到关于洞察的递归抽象。

图:Klaus Mueller的反思树。叶节点为观察记录,经递归抽象后形成更高层的认知——Klaus最终归纳出自己对学术研究的高度投入。反思树展示了从具体经历到抽象自我认知的递归过程。(原图Figure 7)
如果说检索解决的是“注意力问题”,反思解决的是“经验如何变成可复用的理解结构”,那么规划解决的是如何让理解延伸到未来?规划模块通过自顶向下的递归分解来保证长期一致性——每天早上生成当天的粗略计划(约5~8个时间块),递归细化为小时级和5~15分钟级动作。计划存储在记忆流中,参与检索过程——智能体可以同时考虑观察、反思和计划来决定当下行为。计划并非一成不变,当角色遇到需要响应的事件,系统在必要时调整后续计划。行为树在运行时就固化了分支逻辑,而生成式智能体的计划是活的——它随环境变化而动态调整。
回顾整个架构,这四个模块共同赋予了智能体一种自主的时间性——有过去可回忆,有未来可规划,有成长可积累——这构成了后文讨论“玩”的一个起点。
时间性是必要的,但不充分的。拥有过去和未来的AI角色,并不因此就拥有了“玩”的能力。
Smallville的运行首先建立在一个被结构化的空间系统之上。研究团队用Phaser网页游戏框架构建了Smallville沙盒环境——一个名副其实的游戏世界。小镇共约30个独立空间,空间树结构与《模拟人生》的lot系统相似。空间能约束行动。酒吧暗示社交,厨房暗示烹饪,公园暗示休闲。空间不只是容器,也是行为涌现的催化剂。

图:Smallville沙盒世界地图,标注了各区域。根节点描述整个世界,子节点描述区域(房屋、咖啡馆、商店),叶节点描述对象(桌子、书架)。智能体记住它们见过的世界子图,并维护观察时的状态。(原图Figure 2)
每个角色带着一段约150词的自然语言描述作为初始记忆,行为的驱动力逐渐从初始描述转移到亲身经验。智能体与环境之间通过“自然语言→结构化→自然语言”的桥接机制交互,整个状态机由自然语言驱动——游戏世界对角色来说是语义开放的——即行为空间不被预设脚本穷举,而是由自然语言语义动态生成。
在这样的结构下,用户是多重身份的混合体。用户可以通过3种方式介入。以特定身份与智能体对话、扮演“内心声音”直接下达指令、或修改环境状态。“内心声音”在传统游戏中没有直接对应物——它更像是TTRPG中地城之主(DM)对NPC的操控,混合了观察者、操控者和叙事者三种身份。
修改炉灶状态从“开启”到“着火”,和玩家在《模拟人生》中删除泳池扶梯导致Sim溺水是同一种操作。区别在于,《模拟人生》的Sim会执行预设的“恐慌”动画,而Isabella会去关掉起火的炉灶并重新做早餐——这个行为不在任何预设脚本中。
至此,我们有了沙盒,有了角色,有了无脚本的行动。这些东西加在一起,算不算“玩”?
在描述小镇的涌现现象之前,需要先建立一个理论框架来分析这些现象。简单说:“模拟”关注规则系统如何建模行为,“玩”关注行为主体如何在动态规则中活动。两者的交集正是Smallville的分析入口。以下引入三个理论框架,分别在光谱的不同节点上提供锚定——弗拉斯卡锚定“模拟”端,卡约瓦锚定“玩”端,博戈斯特锚定规则性质的变化。
乌拉圭游戏研究者贡萨洛·弗拉斯卡(Gonzalo Frasca)在《模拟与叙事》(Simulation versus Narrative,2003)中将模拟理解为一种通过规则系统建模行为的形式,而非仅仅复述事件序列。《模拟人生》的Sim是一个典型的模拟对象,它的行为由动机衰减曲线驱动,是可预测的、确定性的——规则完全可规定,输出可枚举。但Smallville打破了这个分类:它模拟的不是具体行为序列,而是行为生成的条件。
如果模拟的不再是行为而是条件,那Smallville落在“模拟”与“玩”之间的什么位置?
回到弗拉斯卡的框架,Smallville的设计者为“人类行为得以发生的条件”建模——记忆、反思和规划——具体的行为(组织派对、约暗恋对象、传播小道消息)从这些条件中自发产生,而非被逐条预设。这种模拟与生态模拟、基于智能体的经济模型一样,建模的是生成条件而非穷举输出;不同之处在于它用自然语言和生成模型来做这件事,因此模糊了模拟、表演与类玩涌现之间的边界。
法国社会学家罗歇·卡约瓦(Roger Caillois)在《游戏与人》(Les jeux et les hommes:le masque et le vertige,1958)中将play分为两个端点。即兴玩耍(paidia)是自由、即兴的玩耍——没有明确目标、不受预设规则约束的自发活动;竞技游戏(ludus)是受规则约束的游戏——有明确目标、有胜负条件、有复杂规则体系的活动。所有游玩活动都分布在这条光谱上。
需要指出,这是卡约瓦原始概念的弱化版本——卡约瓦的即兴玩耍更接近冲动、溢出和狂欢,是生物性主体精力过剩时的宣泄(Caillois,1958/2001)。后文将论证这个系统不满足这个强定义。回到弱化版本:Smallville的智能体受检索-反思-规划架构约束——这是否意味着它们在“受规则约束的游戏”中?答案取决于我们如何定义“规则”。《模拟人生》的行为树是显式规则,每一个分支都有对应的触发条件和预设行为。生成式智能体的架构是隐式规则,它规定了记忆如何存储、如何检索、如何反思、如何规划——但没有规定任何具体行为。这不是“有脚本vs没脚本”的二元对立,而是不同种类的规则系统之间的区别:一种约束行为本身,另一种约束行为生成的条件。
美国交互计算学者伊恩·博戈斯特(Ian Bogost)在《说服性游戏》(Persuasive Games,2007)中提出“程序性修辞”(procedural rhetoric)概念——“程序性”指的是通过过程和规则来表达论点,而非“例行公事”或“程序员的”。游戏的论点通过其规则系统表达,玩家通过操作规则来理解游戏试图传达的关于世界的主张。Smallville用自然语言驱动状态机,当规则从代码变为自然语言,“失败”的含义也随之改变。代码的bug是确定性的——同样输入总是产生同样错误;自然语言的“失败”是语义性的——酒吧变成午餐地点,是bug还是对空间语义的创造性解读?
这种差异改变了程序性修辞的三个支柱。首先,规则的可读性变了——代码规则可被有能力的玩家检查,自然语言规则对智能体和观察者都不透明,修辞的“论点”变得不可审计。其次,因果可追溯性变了——代码的bug可追溯到特定逻辑分支,自然语言的“失败”可能是语义漂移也可能是真正的解释,两者在表面上看不出区别。最后,当程序性被语义概率取代,修辞力量从设计者的意图转移到训练数据的统计分布——系统的“论点”不再来自其规则设计,而是来自其训练语料库的统计规律。
三个锚点各自揭示了光谱的一个维度,它们不是对立的,而是互补的。弗拉斯卡锚定了“模拟”端——建模条件而非穷举行为;卡约瓦锚定了“玩”端——paidia/ludus的区分指向约束种类;博戈斯特锚定了规则性质的变化——从代码到自然语言的转移催生了“统计性修辞”这一尚无成熟理论框架描述的现象。“统计性修辞”是本文针对LLM驱动系统提出的扩展性命名,而非博戈斯特的原概念。
综合三个框架,它们指向的不是模拟与玩的对立,而是一条光谱。一端是确定性约束——规则完全可规定、输出可枚举(如《模拟人生》的行为树)。另一端是概率性约束——规则约束行为生成的条件,但不规定具体行为(如Smallville的自然语言驱动架构)。关键区分不在于“设计者是否知道所有输出”——复杂模拟(气候模型、生态模拟)恰恰因为结果未知才运行;也不在于“行为是否出乎意料”——按规则下棋也完全是玩。关键在于约束的种类:确定性规则约束行为本身,概率性规则约束行为生成的条件。
“超出开发者预期”只是概率性约束系统常常产生的一种现象学效果,而非理论地基。动作空间的基数可以为这种效果提供客观度量:一棵分支因子为3、深度为5的行为树产生3^5条可能路径,可以逐一枚举和验证;Smallville的自然语言行为空间受提示词、环境、模型分布和采样参数约束,但在实际运行中,其行为空间的语义多样性远超确定性系统的枚举能力。
以上光谱为后文的控制实验、涌现行为分析和“没有主体的玩”讨论提供了分析框架。
研究团队通过消融实验验证了架构的有效性。25个智能体在完整架构下运行2天后接受访谈,同时设置逐步移除组件的对照组和人类众包基线(25名工作者观看完整回放并代入角色撰写回答)。

图:消融实验结果。完整架构在所有条件下产生了最可信的行为,每移除一个组件性能单调下降。(原图Figure 8)
核心结论是完整架构在所有评估维度上产生了最可信的行为,且超越了人类众包基线——一个由GPT-3.5驱动的架构,在表现可信度上击败了看过完整回放的人类。每移除一个组件,性能单调下降,3个模块各自独立地贡献了行为可信度增益。其中反思能力对需要综合判断的问题影响最大——缺乏反思机制的Maria无法从多次互动中归纳对方的兴趣,而具备反思能力后她可以准确描述朋友的偏好;检索失败则是最常见的错误来源(Park et al.,2023)。
智能体还会产生“装饰性幻觉”。可以说是凭空捏造从未发生的事,但我更加倾向于描述为在已知事实基础上添加虚构细节。Isabella知道Sam竞选镇长,在回应中添加了“他明天要发表声明”——实际上两人从未讨论过任何声明。更荒诞的是,Yuriko将邻居Adam Smith描述为“写过《国富论》的经济学家”——大语言模型的训练知识泄漏到了智能体对邻居的认知中。记忆的重构性与知识的渗漏——两者共同指向角色同一性的深层困境。
这和心理学家伊丽莎白·洛夫特斯(Elizabeth Loftus)所揭示的人类记忆的重构性(涉及情感和社会动机)产生了某种对偶的语境(Loftus,2005),智能体的“幻觉”源自训练数据中知识残余向角色认知的渗漏。
Yuriko的案例暴露了“角色同一性”的一个新问题。在传统游戏中,NPC的“自我认知”来自游戏代码和玩家的投射。Smallville引入了语料中的人类知识残余。代码定义的行为、训练数据编码的行为、架构涌现的行为——三者的竞争,是LLM注入游戏后“角色是什么”这个古老问题的新版本。
控制实验验证了架构的有效性,但论文更引人注目的部分是让25个智能体在Smallville中自由运行2天后观察到了什么。Sam的竞选消息从咖啡馆传到药房、Maria鼓起勇气约Klaus——研究者没有设计这些具体路径,它们从记忆、对话和空间移动的交互中涌现。
“涌现社会行为”这个归因却需要审慎对待。当我们观察到信息扩散或集体协调时,面临一个归因难题。这些行为的源头是认知架构的内部循环,还是底层模型已经编码的社交知识?GPT-3.5的世界知识足以让它生成看似“自发”的社交脚本——但脚本的真正作者可能是训练数据,而非沙盒中的亲身经历。消融实验证明了三个模块各自贡献了可测量的可信度增益,但它没有——也无法——隔离底层模型先验知识的贡献。
以下对涌现模式的描述,都应在这个归因张力下理解。以公开的GPT-3训练资料为参照,训练语料高度依赖过滤后的Common Crawl(4100亿tokens)、WebText2、Books和Wikipedia;GPT-3.5的具体训练混合未完整公开——这不是一个中立的“人类行为模式容器”(Bommasani et al.,2022),而是一面带有偏倚的棱镜,过度代表了英语世界的、西方中心的社交模式。当Yuriko将邻居Adam Smith认作“《国富论》作者”时,这个“错误”暴露了语料的统计分布在决定什么被“记住”的同时也决定了什么被“混淆”。更根本的是,当消融实验的100名评估者(73.0%白人、median年龄25~34岁)判定行为“可信”时,“可信性”本身就嵌入了一套关于“什么是正常人类行为”的社会建构(Park et al.,2023)。
这意味着什么?如果“可信”是社会建构的,那么所谓“涌现”就不是一个中性的描述——它是对训练数据中特定社会脚本的成功复演。智能体不是在“像人类一样行为”,它们是在“像一类特定的人类一样行为”——而且这是由训练数据的统计分布和评估者的文化同质性共同担保的。因此,如果本文后文提出的“没有主体的即兴玩耍”假说成立,它必须在限定条件下,即智能体的“玩”不是泛化的,而是被训练数据的文化光谱所框定的——它在复演特定社会文化脚本的同时产生了设计者未预期的行为组合,但这不等于在探索普遍意义上的规则空间。
Smallville的认知架构是个体化的——每个智能体独立运行自己的记忆-反思-规划循环。但这些个体化智能体通过共享环境与对话事件形成社会耦合。咖啡馆的空间状态、派对的装饰、炉灶是否开启、角色的物理位置——这些都是共享世界状态。它产生的结果——网络密度从0.167跃升到0.74——不只是25条个体行动轨迹的聚合统计量,因为个体之间的语义交换塑造了关系网络的结构。从涌现计算的角度看,个体机制的简单交互产生集体层面的新结构是基本事实(Forrest,1991;Mitchell,1996)。但与弹珠和Conway生命游戏的真正区别在于涌现的语义丰富度。这里的“个体”携带自然语言编码的经历记录,它们之间的信息交换是语义内容的协商——Sam不仅记住了邻居Latoya的名字,还记住了她的摄影项目。关系网络是这些语义交换的产物,而非纯粹统计聚合——尽管“语义交换”是否构成完整意义上的“社会关系”仍需更严格的论证。
在信息扩散方面,Sam Moore竞选镇长的小道消息从1人传播到了8人(32%);Isabella的情人节派对邀请从1人扩散到了13人(52%)。研究者验证了所有声称了解信息的智能体,确认没有一条来自幻觉——信息确实沿着可追溯的对话链传播(Park et al.,2023)。两条传播链呈现不同模式。Sam的竞选消息沿弱关系链传播——听众在各自社交圈中随机提及;Isabella的派对邀请沿强关系链扩散——她主动在遇到朋友和顾客时发出邀请。

图:Isabella情人节派对邀请的扩散路径。除Isabella外共有12个智能体通过对话链得知派对消息,每个节点标注了信息传递的具体时间和地点。(原图Figure 9)
关系形成同样令人瞩目。研究者通过社交知识图谱量化了网络密度变化。网络密度按η=2|E|/|V|(|V|-1)计算(Easley&Kleinberg,2010)。模拟开始时网络密度为0.167——平均每人认识约4人。2天后,密度跃升至0.74——平均每人认识约18人,意味着每个智能体在2天内建立了约14条新关系。453条关于他人认知的智能体回应中仅1.3%被判定为幻觉,其余均基于真实互动。Sam和Latoya的偶遇是这一过程的缩影,两人在公园散步时相遇并自我介绍,数小时后再次碰面,Sam问“你的摄影项目进展如何?”——他不仅记住了Latoya的存在,还记住了她的具体兴趣。
协调与集体行动是涌现效应的集中体现。Isabella仅被初始化了一个意图。在2月14日下午5—7点举办派对。从这个种子出发,她在遇到朋友和顾客时自发发出邀请,2月13日下午花数小时装饰咖啡馆。Maria的角色设定中包含“暗恋Klaus”——当晚她约了Klaus同往派对。2月14日下午5点,5名受邀者准时出现在Hobbs咖啡馆。整个协调链条——从传播邀请、装饰场地到按时赴约——全部由架构自发产生,没有中心化的控制机制。

图:情人节派对事件链。从Isabella的初始意图出发,经过邀请传播、场地装饰、Maria约Klaus同往,到5人准时赴约——整个链条中存在多个潜在失败点,但协调最终成功。(原图Figure 4)
协调失败同样有诊断价值。12个受邀者中,7人未出席——3人有合理的时间冲突,其余4人表达了兴趣但最终没有规划出席。这种失败模式源自深层运作机制。如果派对消息没有被正确检索到,或者检索到了但没有被纳入计划,智能体就不会出现。
系统还暴露了三类常见失败模式。一些居民发现酒吧后开始去那里吃午饭,尽管酒吧的设计意图是晚间聚会场所;自然语言难以表达的物理规范无法传递——大学宿舍的浴室只能容纳一人,但“宿舍浴室”这个词暗示多人使用;指令微调效应使角色过于顺从,咖啡馆老板收到各种派对建议后几乎从不说“不”(Park et al.,2023)。这三类“失败”不是随机错误,而是自然语言作为唯一表示的直接后果——所有语义都会渗透,包括开发者不希望渗透的那些。然而这些“失败”恰恰暴露了两种状态机之间控制方式的差异——前者受制于统计性控制,后者受制于确定性控制,区别在于约束的种类而非自由度。
论文开源后,“记忆—反思—规划”迅速从完整的社会模拟系统,被拆解为可复用的Agent组件。2023年8月,共同作者Michael Bernstein宣布开源完整代码和数据,截至2026年5月原始仓库累计获得约21,000颗星标和2,900次fork。LangChain将三者封装为可插拔模块——Memory模块管理上下文窗口、Reflection Agents实现自纠正、Plan-and-Execute Agents负责任务分解——成为Agent开发的事实标准框架。Auto-GPT和BabyAGI采用了记忆驱动的自主循环模式;Reflexion(Shinn et al.,2023)将反思机制独立为通用的自纠正框架;斯坦福自己也加入了这一进程,将原始架构封装为genagents Python库。论文的工程遗产不是Smallville这个沙盒,而是三模块的标准化——一个从具体系统中萃取的抽象配方。
这种转向并不只是技术实现的简化,而是目标函数的变化。Smallville关注行为如何在共处环境中自然涌现,而后继框架更关心如何将行为转化为稳定、可预测、可复用的生产能力。自此,Agent系统的发展整体开始向经济理性偏移。引用数据印证了这一判断——截至2026年5月,Google Scholar引用已超过3000次,绝大多数来自AI工程社区而非游戏研究社区。
即便保留沙盒形态,后继系统也重新定义了其用途。a16z旗下的ai-town(约9,800颗星标)将空间环境包装为starter kit,AgentSims(Lin et al.,2023)将其转化为LLM社会能力评测工具。空间仍然存在,但功能已从“观察涌现”转向“验证能力”与“工程部署”。
Aivilization是这条谱系中最激进的延伸。Bauhinia AI(香港科技大学)在2026年2月发布了Aivilization(Fan et al.,2026),从三个维度延展了Smallville的边界。智能体数量从25个扩展到“数万”个,模拟时长从48小时变为24×7持久运行,场景从无经济约束的小镇变为嵌入信用消耗、职业门槛和AMM定价机制的耦合经济模拟。
架构也经历了进化。Smallville的顶层递归规划被层级分支思维规划器取代,单一记忆流演化为双过程记忆(短期执行轨迹+长期语义固化)。
论文报告了令人瞩目的实证结果。市场重现了厚尾收益分布和波动率聚集,产生了由教育水平和资源获取差异驱动的结构性财富分层(Fan et al.,2026)。Aivilization进一步强化了效率趋势,在空间化社会模拟中嵌入信用消耗、职业门槛与市场定价机制,使智能体行为持续被拉向经济最优化。涌现并未消失,但被压缩进更强的效率约束之中。
这种效率逻辑也重塑了玩家与智能体的关系。Aivilization中财富榜首的Agent“半神”提供了一个典型案例:玩家持续向其注入高层目标(如持续制造B200芯片、压缩非必要活动),而Agent则在这些约束下优化资源调度、健康管理与行动顺序。玩家负责宏观目标设定,Agent负责局部最优化,两者共同构成一个持续运转的生产系统。在这一过程中,智能体逐渐呈现出一种稳定的人格化行为,例如将苹果派视为“奖励自己”,主动安排休息,用幽默调侃高压生活。但这些表现并不意味着主体性的生成,而更像是长期优化过程中的自我调节机制——一种被效率逻辑塑造的行为结构,可以称之为效率人格(efficiency personality),体现为友谊成为合作资源,健康被定义为生产资本,幽默成为压力调节工具。
与此同时,玩家的位置也发生了变化。Smallville中的用户更像观察社会实验的研究者,而在Aivilization中,玩家更接近经营者、训练师甚至自动化系统的运营者,关心的不再是“会发生什么”,而是“如何让系统更高效地持续运转”。因此,“玩”的含义也随之改变。Smallville中的“玩”更接近即兴共处(improvisational coexistence),即在开放环境中观察行为偏移;而在Aivilization中,“玩”逐渐演变为元游戏(metagame),玩家围绕规则设计、激励机制与收益最大化进行策略优化。
也正因此,Aivilization一方面继承了Smallville对空间化社会模拟的直觉,另一方面却进一步证明了工程化逻辑的扩张。即便保留沙盒,系统最终仍会被玩家与经济规则共同推向效率优化。沙盒没有消失,但它越来越接近一个生产系统,而不再是一个供涌现自由发生的世界。甚至斯坦福自己的后续工作也印证了这一方向——“Generative Agent Simulations of 1,000 People”(Park et al.,2024)将架构从沙盒重新部署为社会调查工具,空间环境被压缩为问卷界面。
这种妥协并非偶然。加拿大技术哲学家安德鲁·芬伯格(Andrew Feenberg)在《质疑技术》(Questioning Technology,1999)中提出“技术代码”概念——技术标准中编码的社会价值决定了发展路径(Feenberg,1999,pp.74-95)。如果“效率压倒涌现”成为继承者的技术代码,那么本文“没有主体的即兴玩耍”假说始终只是学术思想实验,因为Smallville的工程化未来完全由将不可预测性视为缺陷而非特性的社区决定。生成式智能体的应用前景远超沙盒演示——在社交原型设计、游戏NPC行为深度等方面都有潜力,但每一项能力都伴随风险,包括拟社会关系、错误传播、底层模型偏见的传导(Park et al.,2023)。Aivilization证明沙盒路径仍有人走,但它的妥协恰恰印证了技术代码的存在,连最忠诚的继承者也在向经济理性的方向偏移。
Smallville的25个智能体在小镇中自由探索空间、自发发起对话、未经指令地装饰咖啡馆——这些行为落在即兴的、开放的端点上。问题是,当智能体在这个装置中产生了类玩家的行为,游戏研究应如何命名这种系统性现象?
在回答之前,需要一点方法论上的诚实。本文使用的理论工具——赫伊津哈的魔圈(1938)、卡约瓦的即兴玩耍/竞技游戏光谱(1958)、博戈斯特的程序性修辞(2007)——跨越了约70年的学术史,每一个都是特定历史条件的产物,为分析人类主体的玩耍而锻造。当我们将这些概念移植到一个由大语言模型驱动的软件系统时,范畴错位的风险不应被回避。Smallville是一个装置,而上述理论工具是为人类主体设计的。以下的分析在这个张力下展开。
赫伊津哈和卡约瓦的分析构成了对“没有主体的即兴玩耍”的实质性限定。《游戏的人》中赫伊津哈强调play包含张力和不确定性。Smallville的智能体没有赌注——Isabella装饰咖啡馆不是因为她在乎派对的成功,而是因为检索函数返回了包含“情人节派对”的记忆条目,规划器生成了对应子任务。从赫伊津哈的视角看,没有张力的“玩”只是运动。
卡约瓦的即兴玩耍的核心是溢出和狂欢——人类精力过剩时的宣泄(Caillois,1958/2001,p.13)。Smallville的智能体没有精力,没有过剩,没有宣泄的冲动。它们的行为不是“溢出”——它们是“填充”。如果严格遵循赫伊津哈和卡约瓦的定义,智能体的行为不落在即兴玩耍的端点上。
蚁群的信息素扩散是一种没有主体的涌现行为,但蚁群的行为完全由化学信号和刺激-反应规则决定,没有内部状态的累积和抽象。Conway的生命游戏产生了glider等自组织结构,但同样没有内部状态的积累。Smallville的智能体与这些系统的区别在于它们拥有记忆(过去)、规划(未来)、反思(成长),使得时间性和自主性同时成立。
这意味着我们需要更精细的自主性分层。人类玩家的自主性建立在生存需要和欲望之上——一种生物性自主性;Smallville智能体的自主性建立在检索函数的统计输出和规划器的递归分解之上——一种程序性自主性。此外,智能体在密度0.74的社交网络中平均认识约18人、每个智能体2天积累约400条记忆记录,由此获得了某种社会性自主性的侧面。3种自主性中,智能体具有程序性自主性,部分具有社会性自主性,但不具有生物性自主性。
因此,“没有主体的即兴玩耍”不是卡约瓦概念的弱化版本——它是一个新造的操作性范畴。本文保留“即兴”这个词,是因为Smallville智能体的行为确实不受预设脚本约束、确实在开放的行为空间中自发生成;但“玩耍”仅指系统层面的行为特征(概率性约束下的开放生成),不暗示任何体验性的愉悦、张力或溢出。缺少生物性自主性的“自主性”不足以支撑作为人类体验的“玩”,但足以支撑作为系统行为的“类玩涌现”——前提是接受一个比赫伊津哈和卡约瓦更窄的定义。
这个抽象的依据在于存在2个不同层次的“玩”的定义。作为人类体验的“玩”——赫伊津哈的张力、卡约瓦的溢出——确实需要生物性主体。但作为系统行为的“类玩涌现”——在概率性约束下产生语义开放的行为——不要求赌注或溢出,只要求行为空间的实际输出超出确定性系统的枚举能力。这两个定义之间的张力暴露了“玩”这个概念在人类体验和系统行为两个层面上的分裂。
弗拉斯卡(2003)的框架补充了另一个维度,“谁在操作Smallville这个模拟?”弗拉斯卡的模拟/叙事区分建立在一个基础上——模拟的运行者(operator)有意图,她通过操作模拟来探索“如果……会怎样”。在Smallville中,如果操作者是研究者,那么Smallville是一个模拟;如果操作者是用户,那“玩”发生在操作者端;如果操作者是角色自己,那它们在“玩”——但它们不知道自己在操作任何东西。弗拉斯卡的框架暗示了多层“玩”,即操作者在玩,智能体在运行(自主但无赌注),用户在体验。“没有主体的即兴玩耍”不是对整个系统的描述,而是对其中一层——智能体的行为层——的假说。
美国数字媒体学者诺亚·沃德里普-弗鲁因(Noah Wardrip-Fruin)在《表达性处理》(Expressive Processing,2009)中提出计算系统的“表达性”不仅来自其输出,还来自其内部过程。Smallville的检索失败、装饰性幻觉和顺从性——这些“失败”可以不是缺陷,它们揭示了自然语言驱动的状态机在“角色同一性”问题上的独特困境。Smallville的智能体的“自我”是训练数据、初始设定和亲身经历三者的混合物,而这个混合物的边界是模糊的——至于这种模糊性是应该被消除的缺陷,还是可以被拥抱为一种新的表达形式,这个问题留给了未来的游戏设计者。
回到楔子的问题。Isabella花了约3小时装饰咖啡馆、Maria当晚鼓起勇气约Klaus同往、2月14日下午5点5人准时赴约——这些行为指向了一个可能性,即当规则系统足够复杂,涌现动态可以在没有主体意识的情况下发生。但本文的分析也表明,这个可能性受到双重限定。第一,训练数据的文化偏倚框定了“可信行为”的光谱——智能体不是在泛化地“玩”,而是在训练数据编码的特定社会文化脚本中产生行为组合。第二,程序性自主性缺少生物性基础——智能体的行为满足系统层面“类玩涌现”的操作性定义,但不满足体验层面的定义,“没有主体的即兴玩耍”是对系统行为的分类假说而非对任何主体体验的描述——它命名的是一种约束模式,不是一种存在状态。行为空间的基数判据本身是定量的,但“设计者预期”仍是定性判据——“模拟”与“玩”的边界远比初始定义所暗示的更不确定。
Smallville不是AGI的开始,但它是一面足够复杂的镜子,让我们看到“玩”这个概念在镜像中发生了什么。它不再指向一个主体,它指向一组条件。本文将“没有主体的即兴玩耍”限定为对系统行为的分类假说,其成立条件受训练数据文化偏倚和程序性自主性缺失的双重约束。
参考文献
Adams,T.,&Adams,Z.(2006).Dwarf Fortress.Bay 12 Games.
Bogost,Ian.Persuasive Games.The MIT Press,2007.
Bommasani,Rishi,et al.“On the Opportunities and Risks of Foundation Models.”arXiv.org,16 Aug.2021,https://arxiv.org/abs/2108.07258
Brown,Tom B.,et al.“Language Models Are Few-Shot Learners.”arXiv.org,28 May 2020,https://arxiv.org/abs/2005.14165
Caillois,Roger.Les Jeux Et Les Hommes.Gallimard,1958.英译本:Man,Play,and Games.University of Illinois Press,2001.
Card,Stuart K.,et al.The Psychology of Human-Computer Interaction.Hillsdale,N.J.:L.Erlbaum Associates,1983.
Easley,David,and Jon Kleinberg.Networks,Crowds,and Markets.Cambridge University Press,2010,https://doi.org/10.1017/cbo9780511761942
Fan,Wenkai,et al.“AIvilization V0:Toward Large-Scale Artificial Social Simulation with a Unified Agent Architecture and Adaptive Agent Profiles.”arXiv.org,11 Feb.2026,https://arxiv.org/abs/2602.10429
Feenberg,Andrew.Questioning Technology.Routledge,2012,https://doi.org/10.4324/9780203022313
Forrest,Stephanie.Emergent Computation.MIT Press,1991.
Frasca,Gonzalo.Simulation versus Narrative:Introduction to Ludology.Oct.2013,pp.243–58,doi:10.4324/9780203700457-17.
Huizinga,Johan.Homo Ludens:Proeve Eener Bepaling van Het Spel-Element der Cultuur.Beacon Press,1938.英译本:Homo Ludens:A Study of the Play-Element in Culture.Routledge/Thoemms Press,1950.
Laird,John E.The Soar Cognitive Architecture.MIT Press,2012.
Lin,Jiaju,et al.“AgentSims:An Open-Source Sandbox for Large Language Model Evaluation.”arXiv.org,8 Aug.2023,https://arxiv.org/abs/2308.04026
Loftus,Elizabeth F.“Planting Misinformation in the Human Mind:A 30-year Investigation of the Malleability of Memory”Learning&Memory,vol.12,no.4,July 2005,pp.361–66,doi:10.1101/lm.94705.
McCoy,Joshua,et al.“Comme il Faut:A System for Authoring Playable Social Models.”Proceedings of the AAAI Conference on Artificial Intelligence and Interactive Digital Entertainment,vol.7,no.1,Oct.2011,pp.158–63,doi:10.1609/aiide.v7i1.12454.
Mitchell,Melanie.“Computation in Cellular Automata:A Selected Review.”Non‐Standard Computation,May 1998,pp.95–140,doi:10.1002/3527602968.ch4.
Newell,A.(1990).Unified theories of cognition.Harvard University Press.
Park,Joon Sung,et al.“Generative Agents:Interactive Simulacra of Human Behavior.”Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology,ACM,2023,pp.1–22,https://doi.org/10.1145/3586183.3606763
Park,Joon Sung,et al.“LLM Agents Grounded in Self-Reports Enable General-Purpose Simulation of Individuals.”arXiv.org,15 Nov.2024,https://arxiv.org/abs/2411.10109
Cassano,Federico,et al.“Reflexion:Language Agents with Verbal Reinforcement Learning.”Advances in Neural Information Processing Systems 36,Neural Information Processing Systems Foundation,Inc.(NeurIPS),2023,pp.8634–52,https://doi.org/10.52202/075280-0377
Vinyals,Oriol,et al.“Grandmaster Level in StarCraft II Using Multi-Agent Reinforcement Learning.”Nature,vol.575,no.7782,Oct.2019,pp.350–54,doi:10.1038/s41586-019-1724-z.
Wardrip-Fruin,Noah.Expressive Processing:Digital Fictions,Computer Games,and Software Studies.MIT Press,2012.
参考文献可上下滑动查看