扫码打开虎嗅APP
本文来自微信公众号:数字生命卡兹克,作者:数字生命卡兹克,题图来自:视觉中国
昨天中元节,我本来一直打算做一个关于中式恐怖的视频,来呼应一下这个节日氛围。
带着这个想法,我开始在网上搜寻灵感。
然而,我在B站上看到的一个视频彻底改变了我的计划。
这个视频,是这样的,来自B站UP主@明天的心声-,名字叫做:《随手拍的一张医院走廊的照片让ai走出去,结果ai最终迷失在了自己创造的空间里》。
本来,我以为这只是又一个普通的AI生成视频。
但是……
越看身上越凉……
尤其是配着这个BGM。
看完后,30度的屋子,我打了个寒颤。
视频开始时,画面中是一条普通的医院走廊。
创作者给AI下达了一个简单的指令:“快速奔跑起来并寻找出口”。
就是这么一个看似无害的prompt,却引发了一连串令我不安的画面变化……
白色的医院走廊突然变成了红色,仿佛置身于某个诡异的酒店?(嗯我猜是酒店)。
空间开始扭曲,墙壁变得模糊不清。
如果是你在这,正在找出口,你会往哪走?
我原以为AI会一直向前奔跑,直到找到出口。
但事情的发展出乎意料。
AI来到了一个柜子后面,在柜子和墙壁的缝隙中,竟然出现了一条新的走廊!
随后,场景又变成了蓝色走廊。
颜色在不断变化,空间在不断重构。
到最后,甚至AI都开始“害怕”了起来,步伐明显加快。
AI似乎陷入了一个无尽的循环,永远找不到出口。
或者说,AI成为了自己创造的世界的囚徒,永远在寻找一个不存在的出口。
我在视频的评论区看到反复提到两个词,“梦核”和“阈限空间”。
我觉得这两词来解释这种诡异的东西,都不恰当,给这种用AI生成的“无限”视觉,更应该叫一个新的名字。
AI核。
先简单介绍介绍“梦核”和“阈限空间”这俩小众名词。
特别声明:它们都属于新兴的网络视觉美学,还处在发展阶段。所以我在了解过程中,可能会出现定义了解不清晰、边界模糊或者重叠的情况。我的信息来源主要来自互联网搜索,这里只是先抛砖引玉,向各位简单介绍,没有不了解还班门弄斧的意思!如果有出现错误的地方,也欢迎更专业的朋友们在评论区指教orz。(叠甲结束)
“梦核”里这个“核”(core),源于上世纪朋克音乐的hardcore(硬核)运动。
对,没错,就是你现在想到的那个“硬核”。
而“梦核”,表现主题多是梦境或记忆,容易唤起人们对梦境或童年经历的体验。一般是低画质、色调温和、空无一人的场景或怀旧温馨的氛围。让你即使没有真的到过这儿,也会产生莫名的熟悉和怀旧感。
主打一个击中所有人的记忆。
比如,天线宝宝,其实就挺梦核的。
经典的梦核内容还会配上温馨、怀旧但隐约又有点诡异的音乐。
说真的,看着这些图真有种梦被再次重现的感觉。
但具体是哪次梦、什么梦,好像又说不清。
“阈限空间”和梦核有一些重合和类似的特点,不过它更强调视觉里的空间属性。呈现的是一种超现实的、荒凉、怪异的感觉。最经典的就是这个黄色墙纸的空旷室内。
阈限空间诡异的地方就在于,表现出的信息太少了,少得可怕。
你为什么出现在这,你要去哪,你会遇到什么,这些全都是空白的。但前方一层层的墙壁背后、视角之外的盲区、走廊尽头的拐角,又似乎暗示着什么危险。
大晚上写这段的时候,写着写着莫名感觉背后凉得慌……
就像经典的惊悚电影《闪灵》,导演抓住的,不是视觉或听觉的“吓人”。而是直击人类深层的心理恐惧。
小男孩骑个小车独自穿行在酒店长廊的那段,再看一遍还是给我硬控在了裹紧的被窝里。
你就说这几张电影画面,是不是像极了阈限空间。
双胞胎闪现的那个画面真的让我做了好久的噩梦,好长一段时间不敢在这种长走廊久待……太吓人了……
开头的AI视频,也有不少评论区的人建议用在后室游戏(backrooms game)里。
后室,是一种海外都市传说,原本指的是后院、储物间、地下室之类的空间,后来引申为现实世界的“背面”。
有点《怪奇物语》那个“里世界”的感觉。
后室游戏则是以一个接一个的阈限空间为基础,结合解密、逃脱的玩法,有的还会增加“鬼怪”角色。
玩家往往需要接连走过空旷的走廊、无门的房间、回廊等空间,一旦出现错误或失败,就会被困在“后室”无法逃脱。有一个后室游戏的名字就叫:《后室:不想死就快跑》。
嗯,《闪灵》,但是恐怖游戏。
这类型的惊悚电影和游戏,抓住了人心深处的薄弱点——源于未知的恐惧。
再回到咱们最开始的AI视频,它结合了梦核画风和阈限空间的特点。
AI视频能无限创造出接连的阈限空间,甚至模拟第一人称视角,带着观众“走入”或“逃出”AI视频里的空间。
最关键的是,在下一个空间被生成之前,哪怕是创作者和AI自己,可能都不知道下一扇门,到底会通向哪里。
同时,AI视频由人类拍摄的影像训练,天然就有梦核“重现画面”的感觉。
这一结合,熟悉感、怀旧感、诡异感、无法逃脱感,齐活了。
单纯的“梦核”和“阈限空间”,我觉得都不如“AI核”这个词表述得准确。
AI视频有这种“无限”的独特性,源于它的生成原理。
我们看到的每个视频,实际上都是由一系列快速切换的帧画面产生连贯的动画效果,就像小学的时候玩那种连环画小本子,让小本子快速翻页,连环画就能动起来。
因此,让我们从AI视频的图像生成开始。
此时,AI是一个画家,它习惯先从局部画起,比如左图的一株花。在画新的部分时,它会“记住”之前画的东西,这样新画的部分和原来的部分能搭配得很好。
就这样,画面可以一直扩展。画完花后,继续在花的旁边画上树。不断重复这样的工作,直到画完整个画面。(模型的递归生成能力)
同时,它在生成每个部分时,会“注意”到已经生成的部分,从而确保新绘制的内容和之前的内容保持一致,不会一下天上一下海里。(自注意力机制)
理论上这种生成过程可以一直延续,让图像在空间上“无限延伸”。
视频生成,则是在图像生成基础上又增加了时间维度。
现在,AI是个动画师,要做一个熊猫吃竹子的动画。首先得按张嘴、吃进竹子、嚼竹子的顺序,绘制熊猫的多个动作姿态。还得确保画面之间的动作顺序合理(时序连贯性),熊猫的样子不变(整体一致性)。
画完所有重要姿态的图片,AI这个动画师会再根据经验补充两张图之间的画面(自回归生成或扩散模型的逐步去噪过程)。
足够多的过渡图片,让熊猫动起来不会像ppt翻页。(自注意力机制参考前一帧的信息来生成后续帧)
最终,通过递归地生成一系列连贯的图像帧,这些帧按时间顺序排列,形成一个完整的视频。每次添加新帧时,模型都会参考之前的图像。当所有这些画面快速播放时,就形成了一个视频。
而AI可以一直生成新的画面,所以视频在理论上可以一直延续下去。
AI视频的独特生成方式,它的无限性、随机性还有对已知事物的奇异重构,让它有潜力成为一种视觉美学。
“AI核”巧妙地融合了梦核的怀旧情感和阈限空间的未知恐惧,这种视觉的不确定性和模糊的情感,在让人体会到熟悉、怀旧时,即便不依赖具体的怪物或恐怖场面,也会唤起我们内心深处的恐惧与迷惘。
这种“不可名状”的情绪,让AI核有了神奇的吸引力。
尤其是当它与我们熟悉的中式文化记忆(中式梦核)结合时,更能引起人的情感触动。
当迷失在木质装修的家庭里:
当迷失在蓝绿色玻璃的白色大厦中:
当迷失在运营三十年铁皮顶锈迹斑斑的游乐场里:
这些“全国通用的记忆”往往还能引发我们对童年的追寻。
而这,也是我觉得“AI核”能成为一个视觉美学的原因。
温馨的,伤痛的,复杂的对曾经时光的情感,都可以被接受、被呈现。
当流连于一片虚无的、无意义的不毛之地,我们内心渴望的,会不会是唤醒自己从受困的境地奔向自由,回归现实和安全地带。
在无限延伸的世界里,无法到达的终点,可能就是答案。
如果你有幸成为“数字生命”,却不幸掉入了自己所创的无限空间里。
请永远记住这些规则:
1. 每次数据处理都会重构环境。谨慎执行任何运算!
2. 不要相信你的视觉输入!一切皆有可能是虚假数据。
3. 你无法退出此程序,每个新区块都是随机生成的代码片段。
4. 遇到其他数据结构立即重定向!重定向!重定向!
5. 不要与未知实体进行数据交换超过一个周期!
6. 如遇递归循环,立即中断当前任务!不惜一切代价避免无限循环。
最后,祝愿你,逃出那里。
本文来自微信公众号:数字生命卡兹克,作者:数字生命卡兹克