扫码打开虎嗅APP
本文来自微信公众号:APPSO (ID:appsolution),题图来自:AI生成
自从LLM可以生成文本、图像和视频之后,游戏就成了下一个被盯上的目标。
于是Oasis出现了,号称能够实时生成游戏画面的模型——先说结论,不太行。
上周末,Etched和AI实验室Decart联合推出了Oasis模型。这个框架基于Diffusion Transformer,融入了新的自动编码器。为了展示这个模型的能力,开发团队制作了一个类似于Minecraft的小游戏试玩。
这样引起了一些争议:难道不算是抄袭了Minecraft吗?
之前我们曾经在和面壁智能团队的访谈中,提到过Minecraft作为生成式AI试验田的存在。这么多年来,Minecraft庞大的玩家群,以及玩家们创造的数据,成为了宝贵的素材。
同时,作为一个沙盒游戏,Minecraft有极大的空间,让玩家几乎不受任何限制,可以自主创造。
“自主创造”听上去就是一个生成式AI也擅长的事,然而想象都很美好,现实就不一定了。
Oasis做游戏,呈现出来的样子还是比较粗糙。首先是因为周末上线时流量过大,要么登不上,要么被卡出去。
好不容易进去之后,操控比较差,动辄就卡——下图不是静止模式。
基础操作跟Minecraft差不多,只是视线所及范围之内一片模糊:Oasis是实时生成的,意味着你看到每一个像素时,它要么是刚生成出来,要么是在生成的过程中。
甚至,连装备包都是这样模模糊糊一片。这就不太好了吧。
实时生成一直是用AI做游戏里,比较大的一个噱头:没有任何预先设计,没有任何规则,一打开就是进入一个独一无二的全新世界。
但起码从Oasis来看,想象都是美好的,现实都是残酷的。这种实时生成最大的bug就是万物无形,一切都是虚无。
比如我看到远方有棵树,于是决定移动过去看看。只要是保持视野不变化,一直往前走,是能感觉到逐渐接近的。可是等靠近之后一低头,再抬头,树就不见了。
树呢?我那么大一棵树呢?
还有原本是一片山谷,等靠近之后,左右一晃,就变成了一片黄色的建筑物。
其它玩家也碰到过类似的问题。因为实时生成每个人的体验都不同,其中一位up主碰到的是,搭了个棚子,好不容易碰到一群羊,但是羊群跟泡沫一样,随时不知道会变成什么奇形怪状。
更诡异的是下面这个……猪?这一坨是猪?
整体上像用Dall·E一代强行做视频才会有的视觉效果。外网网友锐评:这哪是Minecraft,这是“梦中的Minecraft”。
从延长故事,到全权生成
这两年来,“生成”两个字,有如魔咒一样盘旋在游戏行业上方。很多人在期待的是,AI不再只是工具、辅助,而是,它能不能直接做主,生成游戏本身?
的确有人在尝试,这种尝试是循序渐进的。2020年,在GPT还不为人所知的时候,就有开发者用GPT-2做了一款名为“1001 Nights”的游戏项目。
游戏灵感来自著名的“一千零一夜”神话。玩家扮演主角Shahrazad,具有把文字语言变成现实的超能力。游戏任务是为国王讲一个又一个引人入胜的故事,并且让他提到武器,从而通过超能力,把原本的文字,变为真正的武器,用于跟国王战斗。
这个设定和生成式AI的特性非常契合,两者在“语言”上做文章,追求无限变化、绝不重复的目的。
不过,整体的框架、人物和战斗设计都已经设置好了。AI只能生成和填充里面的故事,而且用户不参与生成出来的故事,它们更像是道具。
文本游戏AI Dungeon则更进了一步,不仅要生成更长的故事,还要更复杂,让玩家能参与。
相比于一千零一夜,Dungeon的故事框架是由玩家先选择,再生成。登录之后,先选择基本的故事类型,比如我选择了赛博朋克。
选完之后,屏幕上立刻出现一大堆字,全都是我要了解的故事背景。
对话框里可以输入prompt,来影响故事接下来的走向。
也可以生图,但是成品比较抽象。
与其说是游戏,Dungeon更像是剧本杀,只不过用了AI来无限生成所有剧情,又有点像升级版的对话机器人。行动、台词、场景都可以按照自己的prompt来。
不过,只有文字,不能算真正意义上的游戏。所以才有那么多人,总是对用AI生成一整个游戏抱有期望:不仅是文本、故事,而是基于一个生成的故事,再有生成的画面、再有生成的操作系统。
当技术能达到那样的水平时,人人都可以做出自己的游戏来。几个月前,米哈游创始人蔡浩宇,在领英上就发表过类似的言论:
“未来只有两种人有理由继续坚持做游戏:1. 最顶尖的、那0.0001%的天才,去打造世人从未见过的东西;2. 99%的业余爱好者,用来自娱自乐。”
当不了那一小撮天才,但当个业余爱好者自娱自乐有什么不好呢?
生成和游戏的本质冲突
实际上,游戏是一个离AI很近的行当,对生成式工具的应用早已有之,包括进化算法和神经网络。
在游戏的程序化内容(PCG)生成方法中,设计师和工程师通过设计程序,仅仅需要人工有限的输入,就可以生成游戏内容。比如角色、地图、材料,甚至是故事和npc角色等。但PCG的不会完全脱离人,基本的规则还是由开发者们来制定。
这是AI被寄予厚望去颠覆的地方:一切都交给人工智能。让AI的不确定性,成为游戏的核心,创造每一次都不重复、永远独一无二的体验。
不确定性当然是给游戏带去乐趣的关键因素之一,但并不是唯一。更重要的是,LLM自身所制造的幻觉,和开发者们精心编写出来的“随机性”,不是一码事。
法国鼎鼎大名的哲学家、社会学家罗歇·凯卢瓦,著有《游戏与人》一书。
他在里面提出了评价游戏的六条原则:
1. 自由性:游戏者不是被迫参与游戏,否则游戏将立刻失去诱人和愉悦的休闲本质。
2. 抽离性:游戏被限制在提前设定的、确切的空间与时间范围内。
3. 不确定性:游戏进程不可能提前确定,游戏结果不可能提前获知。在游戏必要的创造过程中,游戏者必须掌握一定的主动权。
4. 非生产性:游戏不创造资产、财富或任何形式的新元素。此外,除了游戏者之间的财产转移,游戏结束时的状况与其开始时的状况别无二致。
5. 规则性:游戏受规则约束,这些规则暂时搁置惯常的法则,生成全新的、唯一有效的评判体系。
6. 虚构性:游戏过程伴随着一种对次现实或非现实的独特认识,有别于日常生活。
这六条原则里,既有不确定性的一席之地,又强调了确定性规则对游戏的价值。
换句话说,通过一系列的取舍和平衡,才做到了第六条,让游戏过程区别于日常生活。
正是“确定”与“不确定”之间的微妙关系,让游戏开发如在钢丝上舞蹈,困难是有,却是创造美妙游戏体验的不二法门。
本文来自微信公众号:APPSO (ID:appsolution)