机器学习、虚拟世界与元宇宙 Metaverse-虎嗅网

本文来自微信公众号：rct studio，作者：张言、陈雨恒，制图：潇潇，题图来自电视剧《爱，死亡，机器人》

1. 引言：轮回与机器学习的相似性

1.1 宗教体系下的“轮回”

在宗教的知识体系中，人们经常会谈起一个名词叫做“轮回”。它是生与死不断循环的过程，印度人认为，在轮回中的生灵经历着永恒的痛苦；在佛教看来，永生和不死，仍然在痛苦的轮回之中，唯有所谓的“空”或者“无我”，才能从轮回的痛苦之中脱逃出来。

“轮回”的梵语转写为：Saṃsāra。严格来说，这是一种思想理论，它认为生命会以不同的面貌和形式，不断经历“生死”。在东方有例如印度教、佛教、道教承认这种思想，在欧洲有希腊的轮回哲学，例如毕达哥拉斯及柏拉图等；而作为一种宗教体验，它则被认为是世界的另一种真实，或者说是感官所认识世界的一种延伸。

当然这是一种偏向于“宗教”般的描述，佛教认为如果想要通过实践的方式证实轮回的存在，则有三种途径：1. 死后；2.开悟后；3. 特殊情况下。但从现实意义的角度来说，这三种方式都暂时无法在短期内体验，不过假如我们从逻辑推理的角度来尝试呢？

佛教本身对于轮回转世的研究，其实可总结为“因果律”，简单来说就是世界上第一粒植物种子和第一个人都是不存在的。如果有第一颗植物和第一个人，就是违反因果普遍性逻辑规律的，因为种子的前因是种子，人的前因是人，永远不可能有“第一个”无因的种子和无父母的人。

同时，在下一个推理过程前，做了一个先验性的假设：任何事物的本质都是“空”或者“无我”；从而得到这样的推论：因为任何事物和任何生命的存在，都是处在“时间”或“万物发展规律”上的前后相续的一个运动过程，而且事物和生命本身又是一个新旧物质和新旧生命的“因果链”，这个因果链在逻辑上无法找到它的“开头”和“结尾”。

局部事物有始有终，事物总体无始无终；同样人的一生有始有终，但作为人的生命的整体而言，这一生只是整个生命过程中的一个保持相对稳定的“生命阶段”，过去曾经无数个这样的“生命阶段”，今后仍要经历无数个这样的“生命阶段”，这就是佛教生命续流和轮回转世说的逻辑推理根据。

在本文正题开始前，将“轮回”作为引言的原因，是因为我们看到了“轮回”和“机器学习”的一些惊人的相似性。让我们不由地猜测，宗教里谈及的概念和认知和我们通过 AI 技术尝试打造的虚拟世界之间，是否存在一些可能的关系？

“轮回”的前提：

因果律的存在（时间是一种错觉，并不存在过去、现在和未来）
超越“轮回”之上的规则（一切事物的本质）

“机器学习”的前提：

因果律的存在（时间是一种错觉，并不存在过去、现在和未来）

超越“轮回”之上的规则（一切事物的本质）

具体的表现则是，在“轮回”的概念中，人和生物的每一世都是经历和体验，前一世的所积累的“业”会基于因果律的规则，指向下一次轮回的不同开始。同时，前一世的经验和知识会通过一定的方式传递给下一世，不过前一世详细的经历和记忆并不会完整地继承；并且从逻辑上来看，就算是继承了前一世的经验和知识，在这一世仍然需要特定的条件才能获取“密钥”。

这样的“密钥”对于不同生物来说也是不同的，有些生物天生就有，但始终无法通过正确的方式使用；有些生物是在后天获取的，由于使用了正确的方式，“密钥”开启后则获取了部分或全部的来自于轮回的信息和知识。

1.2 机器学习的相似表现

对于机器学习来说，前一步的动作和状态会决定下一步机器的判断和决策。如果状态之间的转移是有规律的，则机器就可以学习，或者让机器自己去发现规律，这也就是马尔科夫链。该过程要求具备“无记忆”的性质：下一状态的概率分布只能由当前状态决定，在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。

简单来说，就是：“你的明天，只与你的今天有关，和你的过去并没有直接的关系。它是通过你的今天，从而和你的昨天产生了关系”。

在因果律的引导下，无论是机器学习的任何一种类型（监督学习、无监督学习、强化学习），事实上都面临着来自于设定和规则的约束。而这一类的限制，恰恰是在计算开始前所必须规定好的，从而对应的运算过程才能按照一个给定的框架下进行。

在强化学习里的一个经典场景是，我们构造这个场景下的规则和角色的设定，并构造一定的目标，从而让角色能够快速地在这个目标框架下，反复地进行训练，并且逐渐地学习并展现出智能。在一些最基本的寻路、生存等场景里往往可以有着极其有趣的表现。

假设我们在这个场景中设定了角色的生命周期以及繁衍的规则，机器所构造出来的“生物”就可以如同真实世界里一般进行决策与行动，并且以数据的方式积累学习到的经验与能力，并在下一个回合或者轮次中再次决策与行动。

当然，如果我们设定了所谓的“死亡条件”，或者一个周期或轮次的结束标志，以人类的视角去揣测机器生物的状态，则就是发生了“轮回”事件：机器生物在一次又一次的结束与开始中，获得了越来越多的知识与技能，逐渐表现出“智能”。

对于强化学习来说，想要让这样的生物获得“智能”，一般来说都得经历几十万、几百万甚至上千万次的训练和模拟。同时我们也能注意到传统的宗教知识体系中，宏观地来看，如果想成佛，或者说达到“无我”与“空”的境界，需要经历数亿次的轮回，体验人间百态。

从相关性的角度来看，宗教和强化学习虽然相隔甚远，但二者似乎又存在千丝万缕的联系。宗教中描述的场景和世界，是过去的人类对于某种事物的一种描述，这一类事物也许是一种规则，也许是一种超越性的理解和认知，而很显然，这个认知可能是人类通过不同的推理路径最后都会到达的一个共同的终点。

尽管在整个机器学习领域，我们尚无法真正理解机器人类的推理过程，但是在更加宏观地如何让机器去产生智能这件事情上面，计算机领域也和很多基础科学领域一样，最终都绕不开回到了宗教的问题上。

对此我们暂时无法以严格的科学途径去获得结论，不过机器学习为我们提供了一种非常可行且合理的方式，去构造一个近似于真实环境的虚拟世界，让我们能够以更“自由”的视角去思考与探索。

2. 规则与机制：机器学习的可能性

2.1 用于构造“真实”的载体

在讨论机器学习之前，我们需要先明确一个问题：什么样的对象能够成为“载体”，从而使得机器学习能够在这样的环境或规则下，尽可能地模拟真实世界的运行方式。

首先，这种“载体”应该是可持续的。原因也很简单，对于一个不可持续的“载体”来说，无法实现机器的连续学习与决策，从而单个回合或者轮次中获取的信息或经验不可被传递。因此无法做到机器学习所要求的数据积累与迭代进化。

其次，这种“载体”应该是可稳定的。稳定的“载体”能够提供相对不变的约束和条件，从而能为机器的连续计算和学习迭代，提供一系列稳定的规则和设定。

同时，这种“载体”应该是可复制的。在科学的发展中，一切科学实验的成果都必须要做到“可复制性”，才能被接受为真实的成果。不可复制的“载体”不足以能够让机器所构造的世界实现规模化与泛化，从而无法遵循连续一致的规则和设定。

在当前的产业格局下，似乎只有电子游戏领域，或者电子游戏作为这种“载体”能够满足以上的条件：

电子游戏是可持续的。在一款游戏的整个生命周期中，它可以被认为是在特定的“代码时空”中连续且不断发生的，除极个别游戏外，大部分游戏世界里的时间尺度都是独立于现实世界时间尺度存在的。机器可以在这样的一个连续环境里，获得充分的时间尺度，从而持续地进行计算、学习和迭代。
电子游戏是可稳定的。电子游戏的特殊之处在于，每一个游戏都是创作者用代码构建出来的虚拟时空。在这些虚拟时空里，世界运行的规则和设定都是完全由创作者清晰定义出来的，而游戏本身也会由机器严格按照这些代码构建出来的规则运行。在电子游戏的另一端，则是线下的桌游、跑团类游戏等等，这类游戏体验的特色之处也往往是在于更多的人为因素的介入，从而获得不一样的体验，但它们却不能像电子游戏一般从本质上就保证了他们的稳定性。
电子游戏是可复制的。游戏的可复制性分为几个层面的意义，首先是游戏内的可复制性，其次是游戏间的可复制性。基于游戏的连续性，在游戏内无论是图像化的场景、角色和动画，还是逻辑化的对话、剧情和叙事，游戏内的内容都是可以被复制和规模化的载体。而在游戏之间，不同游戏的环境、物体、物理规则等图像层面的对象是可以被重复迁移的；自从 rct 推出了混沌球算法，不同游戏中的人物、角色和剧情叙事等都可以被规模化地复制到其他类型的游戏中，同时携带其在对应游戏中经过训练、学习和迭代后的记忆、经验和知识。

如果说，随着图像技术的发展与创新，我们对于一个游戏所代表的虚拟世界的视觉认知逐渐地朝向真实世界在靠近，那在我们所获取的视觉信息背后，同样需要一个逻辑规则来以正确且合理的方式组织信息，从而让我们以更沉浸的体验去理解这个世界和我们自己。

在过去，仅仅依赖于以决策树和状态机为代表的传统游戏 AI 技术，是无法满足游戏中我们在逻辑端对于交互日渐增长的需求，更别说以一个近似于人脑处理信息的方式来组织信息并生成合理的逻辑结构。现在有了混沌球算法，我们可以完整地同时在逻辑端和图像端去打造一个真正的“Simulator”，也就是我们经常看到的像《黑客帝国》里提到的“模拟器”概念。

来源于《黑客帝国》

简单来说，如果我们的算力足够强大，能够极尽详细地模拟人类世界的每一个细微的状态参数，我们是否能打造一个几乎和我们现实世界一模一样的虚拟世界？同时，也有不少哲学家、物理学家和企业家（比如 Elon Musk）认为我们正身处一个非常强大的“计算机模拟”中，我们体验到的现实只不过是该程序的一部分而已。

对于这个问题，有一种解释是，对于我们正在生活的这个世界，假如我们的科技不断发展，我们会逐渐地接触到我们这个世界的“边缘”，从而对置于我们之上的世界造成威胁，那么出于生存需求，上层必然会毁灭下层。从而人类的选择只有向下继续建造，虚拟世界就会被嵌套无数个。目前之所以我们还存在，是因为之前嵌套的无数个都选择了造自己的模拟器，否则中间有一个不这么干，这个系统就崩溃了，所以模拟器嵌套几乎是必然的。

而同时，电子游戏几乎是一个完美的模拟器雏形，在 AI 技术的加持下，我们能从逻辑端和图像端开始构造虚拟世界，并在后续逐渐搭建与完善人类的整个认知系统，不断地向一个完整的模拟器靠近。

当我们锁定了“电子游戏”作为走向虚拟世界的实验载体，我们也会发现，传统意义上的“游戏 AI”仍然需要通过人工提前预设好具体的对话、行为、动作等，才能通过一些规则来对玩家的交互做出看似“智能”的反应。

2.2 在虚拟中实现真实的“合理性”

与此同时，以神经网络为代表的人工智能体系，已经在图像端展现出了具体的应用前景，配合上多层神经网络的加持，监督学习和无监督学习在计算机视觉领域的应用已经渗透到各行各业；但监督学习和无监督学习是否能实现模拟人类的逻辑处理系统呢？

监督学习其实就是机器在人指导下的训练，如同做题一样，人们会给它配上标准答案。每做完一遍，就检查一遍是否完全正确，如果错了就重新检查一遍看看哪里做错了，从而不断地优化做题的方式和思路。对于机器来说，就是通过给其投喂已经标记过的数据，让他去训练和学习，最后给它一个新的数据集，看他是否能通过“学习”到的思路的方式，去给出对应的学习成果。

无监督学习则连题目的答案都不给了，同样以通过投喂数据的方式，让机器自己去摸索这个答案“应该”是什么，从而告诉人们这一类题目的特点和解答的方式。

不过这两类机器学习似乎和人类成长过程中所使用的思考和学习的方式相差甚远。人们在小时候认知一个物体或者学习一个技能的时候，并不会投喂很多数据，或重复训练几百万次；我们仅仅是通过一些似乎很“简单”的方式就学习到了知识。或者说，我们对于这个世界背后的知识框架的认知逻辑，是另一种方式，而这种方式让我们能快速组织获取到的信息。

但是，我们在强化学习上看到了希望。它不需要投喂数据，同时就像我们获得知识的方式一样，我们会在一个具体的场景下被告知某个物体或者某件事的规则是什么，我们能做什么，不能做什么，然后我们自己通过实践的方式去获取反馈并调整对应的认知。

强化学习唯一不确定的地方，也是有希望带来更大突破的，也就是强化学习的过程是非常黑盒的，距离我们人类真实的逻辑推导过程还有距离。但是在我们无法清晰定义人类的逻辑推理过程的前提下，强化学习也许是人类唯一的希望。

按照我们之前说的分析框架，在逻辑端同样出现了以强化学习为代表的尝试与一些惊人的效果，比如 Deepmind 的 AlphaGo Zero，就代表了在单一目标下的学习框架，AI 在和自己博弈的过程中学到了超越人类选手的“智能”。然而针对与现实世界更相似的“多智能体复杂目标”决策逻辑，在混沌球算法出现前，强化学习都尚未存在一个完美的框架去解决。

电子游戏作为一种场景和虚拟世界的可能性，为了尽可能地映射人类在真实世界中的情景，自然也有许多分类和玩法，从而展现人类不同的需求：

比如关注社交体验的一些游戏，通过塑造相似的社交场景，来满足人们在沟通或者倾诉上的需求。又比如挖掘人们胜负欲和攀比欲的一些游戏，也很自然地把真实世界中人们会发生竞技和争夺的场景搬到了虚拟世界里，满足人们的虚荣心。不过争夺的对象和争夺的形式又会变化多样，比如争夺生存权、争夺比赛胜利、争夺有限物资等等。

来源于《魔兽世界》

还有另一种游戏，它展现的是人们对于另一种身份和能力的渴望，人们可以在虚拟世界中成为另一个自己，体验不一样的“人生”。这一类游戏一般会伴随着对于虚拟世界的自由探索，如同真实世界一样，去体验并感受不同的剧情。如同我们在真实世界中和人相遇，并坐下来聊天一样，我们对于彼此要交流的内容完全不会提前设定好，我们交流的方式和内容是基于每一个人的性格特点、背景知识等来决定的。

来源于《模拟人生 4》

强化学习让我们看到了塑造一套完整的逻辑框架的可能性，并在此基础上对我们从视觉和图像层面获取的信息进行杠杆式的撬动，提高我们获取信息的效率，从而更好地在虚拟世界里“成为”另一个自己。

当我们谈起人工智能是否能帮助我们打造另外一个自我时，宗教知识体系有这么一种描述，他们认为“不仅时间是不存在的，自我也是不存在的”，或者说“自我和整个世界是一体的，自己就是世界，世界中的每一个物体也都是另外的自己”。这种状态被称为“无我”，而这样的思考，本质上是对世界“本质”的认知探索。

生物科技和神经科学经过几十年的研究和发展，已经发现人类大脑的区域是模块化的，不同模块负责处理不同类型的信息。在游戏中，相比起传统的决策树和状态机机制，机器学习能更加适合“模块化”地打造对应的角色形象。

比如，基于强化学习的混沌球算法构建了不同角色的大脑，给予角色以指令，让虚拟世界中的角色能够在不同的环境、条件和规则下进行自我思考和学习；有了控制中心，一个完整的“角色”仍然需要情感化的表达语言甚至是戏剧化的文本到语音生成算法；除此之外，在大脑的指令控制下，肢体动作的运动也需要更加动态的实现技术，才能在虚拟世界中还原动态且自然的动画。

EEG powered by BCILAB

另外，模块化的大脑控制体系，更多代表了智能生物体的理性决策机制。休谟在 18 世纪时就认为：理性是激情的奴隶；单纯的理性根本不可能成为任何意志行动的动机；同时理性只有通过影响“感觉”这个终极激励因素，才能让“理性”在决策流程上起到一定作用。

从理性的角度来看，机器能够严格地按照逻辑判断和反馈进行问题的处理，但它们是否能够在“感觉”层面，感受到快乐、痛苦、好奇等情感和认知，作用于理性判断的基础呢？

2.3 人类之于虚拟生物就是高维物种

人类的智能分为物理性和化学性两种方式的智能，实际上也就是理性和感性的区别。理性的智能背后其实就是人类严密的逻辑推导，尽管人类的逻辑推导其实是基于语言体系的，但是我们所有的看似自由意志的决定，背后都有着可以被复现的逻辑推导过程。

当人们在抖音快手上被带货主播们用简单的几句话就引导下单的时候，实际上就是大部分人的逻辑推导过程被主播们精准掌握的结果。电子游戏正是由于它拥有高度结构化的数据和逻辑推导过程，成为了我们非常合适的实验场景。

人和其他所有的生物，包括了我们在虚拟世界里所构建出来的这些生物，最大的区别在于我们拥有基于激素等化学物质组成的一套感性体系。人们可以感觉到快乐，悲伤，愤怒等等情感，它们背后是一套复杂的化学物质在对我们的大脑产生作用，而这些情感确实也是我们人类智能的一个重要组成部分。然而，这一套体系我们是不可能在基于 0 和 1 的计算机体系里实现的，那么对于虚拟世界里的生物来说，感性是什么呢？

在基于混沌球算法所构建出来的一个很小很小的虚拟世界的场景里，我们在算法训练的过程中会至少在这个场景里反复模拟数百万次不同的剧情。由于智能体对于虚拟场景的理解和感知完全是基于数据的，每一次剧情的模拟时间可能就只需要数百毫秒。那么，我们可以认为，这个虚拟时空里的时间尺度是独立于我们现实世界的。

这些虚拟生物所感知到的时间和世界，就是他们所看到的世界。而我们在看待这些生物的时候，就像是其他更高等级的物种可能会在更高维度的宇宙上观察我们一样，我们看到的可能是输出的数据、可能是图形化的界面、也可能是虚拟现实里的体验，但实际上这些都只是这些虚拟生物所能感知到的世界的更高维度表达。

从这个角度继续延续下去理解，由于这个基于数据的虚拟世界里不存在化学反应，且所有的逻辑和感知都是由 0 和 1 组成的数据来实现的。那么实际上，我们所理解的虚拟生物的感性决策，是从我们所认为的感性出发来理解的，而如果我们就是“他们”，那么我们所能理解的感性，就是基于我们所在的世界的边界来决定的，也就是对于数据的感知来实现的。

来源于《爱，死亡和机器人》

反过来看，即使在我们所在的现实世界里，也有非常非常多用基础科学都无法解释的，不断出现的新发现，而人类的科学家们所做的事情，不过是不断地用现有的或是新创造的理论去解释这些新的发现。现在的基础科学体系已经深入到量子力学，这就是典型的世界边界附近的模糊地带。

也许突破这个地带我们就能够发现更高维度的宇宙，也就是我们之于这些我们创造出来的虚拟生物的所在。但问题就在于，也许人类永远无法突破量子力学这个世界的边界，或者甚至是当人类有能力突破了这个边界之后，整个世界的意义就会如同前文所说的一样被证明，那么全部的认知都会被改写。我们试图通过向内探索，通过相反的方向去发现我们向外探索的过程中期待的结果。

所以，当我们看着我们训练出来的虚拟生物，在虚拟的场景里模拟出各种各样的剧情的时候，我们就像是可能存在的造物主在更高维度的展示形式下观察我们的时候一样，会从我们的角度想方设法去理解他们。但是，就像在不同语言体系下的人类，在相遇的时候也可能出现类似的情况一样，这些虚拟生物，作为一种“类人”的虚拟生物，已经具有了初步和简单的人类智能，而这个智能，我们更多的是需要站在“他们”的视角去理解和感知。

当然，这些虚拟生物的存在，就是给玩家带来更有趣，更开放的虚拟世界体验。因此他们并不会想到，自己所“认为”的世界其实是被精心设计好并为了这些更高维度的智能而服务的，他们会和玩家对话，会试图和玩家结盟，也可能会试图占玩家的便宜，但他们不可能超越 0 和 1 的世界而知道我们的存在。而我们人类又何尝没有想过，每个人匆匆忙忙而辛苦的一生又是为了什么呢？

3. 连接与超越：元宇宙的崛起与未来

3.1 元宇宙的描述与定义

元宇宙（Metaverse）的概念最早来源于尼尔·斯蒂芬森（Neal Stephenson）的著作《雪崩》（Snow Crash），该书首先描述并创造了“元宇宙”的概念和描述。事实上，自上世纪 70 年代末和 80 年代初以来，在科技领域中，很多人都是设想过这种属于未来的状态。Metaverse 这个词是由 Meta 和 Verse 组成， Meta 表示超越， verse 的意思是宇宙 universe，合起来通常表示“超越宇宙”的概念。

这一概念指向了人类长远的发展目标，我们可以创造属于自己的宇宙，它将平行于现实世界运行、成为一个人造的维度空间。大家认为，互联网的下一个阶段，是由以逻辑端、图像端技术和各种终端硬件支持的虚拟世界。

关于元宇宙的特点，我们可以大概归纳出一些描述：元宇宙将会是一个始终在线的虚拟世界，有无限量的人们可以同时参与其中。它也会有完整的经济系统在不间断地运行，并且可以跨越真实世界和数字世界。同时，任何基于数据信息的形象、内容、财富等都可以在元宇宙流通，很多人、很多公司都会创作内容、商店以及体验，来让它更繁荣。

来源于 Gfycat.com

人们所达成的共识是，元宇宙不会一夜之间出现，也不会是仅由一家公司打造和运行的。如同真实世界一样，元宇宙将会由非常多的公司、组织、个人等来共同实现，同时也会由许多独立工具、平台、基础设施、标准和协议等来支持其运行。

有很多评论和见解认为，元宇宙非常像现在我们定义的“游戏”，因为在目前所有数字化的领域中，游戏似乎也是最接近于元宇宙的一种形式。不过如果我们以一种动态的视角去看这个新物种，我们会发现，之所以我们认为“元宇宙”是一种游戏，是因为我们在使用当下的理解去理解未来的形态。

3.2 元宇宙的特点与表现

事实上，我们认为，元宇宙（Metaverse）在计算机出来的第一天就开始发展了，并随着技术的进步和应用的增加，元宇宙的版本也随之不断地进化和迭代。需要注意的是，目前整个人类社会实现可以被称为元宇宙的阶段，不过我们也“似乎”正在朝向这个方向在进行发展和积累。

在对元宇宙发展阶段进行描述前，我们需要先解释的是：“游戏”“虚拟世界”“元宇宙”这三个词所代表内容的关系。总的来说，我们认为：

“虚拟世界”是相对于“真实世界”而言的一个定义；
“元宇宙”是在“虚拟世界”这个大类下，对于“可连通信息”的总称；
广义来看，“元宇宙”是“虚拟世界”内和每一个参与主体发生交互的信息本身、交互形式、交互过程的总集合；
“游戏”是现阶段我们对于“虚拟世界”进行认知与交互的最直接载体；
广义来看，“虚拟世界”里的社交、支付、购物等等，都为以“游戏”的形式开展；
多个“虚拟世界”之间若不能相互流通，则单个“虚拟世界”或整个集合就不是“元宇宙”；

这里需要解释一下，多个“虚拟世界”不能相互流通的指的是：不能以一个类似于 one-pass 的统一身份进入各个“虚拟世界”“游戏”“社交”“电商”等，同时无法以统一或者一致的经济系统进行交易。

Epic 说自己要做 Metaverse，是因为驱动游戏的底层引擎 Unreal Engine 是他的，也有 Epic Game Store 作为交易中心，同时与其他数字化基础设施相契合。事实上，Steam 也可以算 Metaverse 的初期阶段。但目前这种这种经济交易是初级的，只是表层的统一账户购买，不是深层次的连接游戏内的经济交易系统。当然其实要做的话也不难，把每个游戏的游戏内交易机制和平台的交易系统统一挂钩就行。

同时，考虑到“时间”的效应和影响（我们暂时认为时间是存在的），“虚拟世界”中的时间尺度是可以被任意设定的，但作为被连通的“元宇宙”的时间尺度也需要是一致的，但不必和现实世界一致。这里的一致性并不是指所有“虚拟世界”或者“游戏”内的时间需要全部保持一样，而是说需要有一个“连接”的机制，使得它们如同不同的齿轮镶嵌般运转。

这样的话，基于一个成型的 Metaverse，如果我们在未来实现了意识上传，我们就完全可以在Metaverse 里生活、社交、体验不同生活等等；如果暂时还不能上传意识，只能单向地生活在虚拟世界的话，真实世界的躯体只要能维持生命，就可以一直在“元宇宙”里生存。

站在当前的角度来看，微信、Facebook 等社交平台构建了虚拟的社交世界，淘宝、Amazon 等电商平台构建了虚拟的购物世界，事实上现实世界中的个人或机构都在充当这个“元宇宙”的扮演者，大家都或多或少在构建并连接各个“虚拟世界”，从而形成更大的一个彼此都能够在其中生存和发展的“虚拟世界”。这也是为什么“元宇宙”不是由一个公司所打造的。

因为“元宇宙”和“虚拟世界”的区别就在于“连通”，每个人的身份也是“连通”的关键一环。每个人在不同平台所构成的“虚拟世界”里，就是有一整套身份 ID。只要不连通，则它们就不能作为一个整体，也就不是“元宇宙”；但一旦连通，那就是 Metaverse 了。比如 Apple 账号代表的是，各种 App 和 App 内的信息；Valve 账号，代表的是各种游戏信息，这要是“连通”了，就可以在 CS:GO 里展现出你切水果（水果忍者这个 App）的能力和一些其他的属性和特点。

所以，“元宇宙”也是一种真正意义上对虚拟身份的“连通”和“认可”。

另外，“虚拟世界”里面的物理规则也可以完全和真实世界不一样。比如我们在“虚拟世界”里要从一个地方到另一个地方，我们仅仅需要在代码层面设定好规则，就直接跳转了。这样的方式在“虚拟世界”里，就是 1 和 0 规则下的地址定义。

而在真实世界，假设我们也是活在上一个层级所打造的“虚拟世界”里，如果想要实现穿越或者瞬间移动，我们就需要找到真实世界里的 1 和 0 规则（或许是弦理论中的弦）。一旦掌握了当前我们真实生活世界的编码规则，时空穿越无非就是确定不同状态下的“地址”，通过一个定义和跳转机制就过去了。

所以研究 Metaverse 的意义会比只讨论“虚拟世界”大很多，因为可以更加好地模拟与探索真实世界的社会和环境。对于 Metaverse 来说，图像层面只会是算力的问题，但逻辑层面，就需要把实时、自动的交互逻辑设计好。

因此，“元宇宙”的另一个核心表现就是，“虚拟世界”里的信息和内容会再次爆增，并反哺真实世界。

需要再次强调一下，广义地来看，“元宇宙”的一切都可以称为“游戏”，但不是所有“游戏”都是“元宇宙”的一部分，因为有些“游戏”就是不连通。同时有些为“虚拟世界”服务（或者为真实世界服务）的电商，如果账号体系和经济体系不连通的话，也不是“元宇宙”的一部分。这也是因为，在“虚拟世界”里面的交互、购买等等，一定也是配合虚拟化的图像场景的，所以称之为“游戏”也不为过。

当“游戏”、社交网络、电商等被连通后，如果按照今天的视角，会带有强烈的游戏特点，因此我们可能会有这样的想法：不就是个虚拟游戏嘛。但站在未来的视角，它不仅仅是“游戏”，它就是“元宇宙”。我们现在玩游戏的目的可能是为了获得感官刺激，或者为了在真实世界赚钱或者变得更好；不过有了“元宇宙”后，我们玩游戏可能是想要为了另外一个“游戏”中的生活更好，或者为了在虚拟商城里买东西，然后在社交网络上聊天，然后去下一个“游戏”场景中约会......

特别是对于“元宇宙”来说，“游戏”将会成为是一个广义的概念。因此，我们可以说“元宇宙”的简化版本，就是 Epic 或 Valve。社交网络这样的物体，只要没有连通，就不是“元宇宙”；一旦连通，那就是 Metaverse，同时也带有了“游戏”的属性。

3.3 元宇宙的发展阶段

目前根据计算机相关技术和整个互联网的发展轨迹，我们从信息的角度入手，将元宇宙的发展对应地分为几个不同的发展阶段。

Metaverse 0.1 版本：底层规则建立（1940s~1970s）

在这个时期中，电子计算机处于刚被创造出来的发展初期，人们设计了二进制的编码进行储存和计算，并在基础上拓展成“冯·诺伊曼原理”。同时，我们也设定了一套标准的“沟通机制”，用于以代码的方式去和计算机沟通。也许当时的人们并没有意识到，正是这样的底层规则，不仅开启了虚拟世界的大门，也将两个完全不同的世界从代码输入的那一刻联系了起来。

Metaverse 0.2 版本：信息基础传递（1980s~1990s）

随着计算机技术的不断发展与更新，最初的电子数据交换也发展成了互联网，并逐渐开始其“连接”的使命。在这个过程中，我们从过去的“面对面”信息交流和沟通，变成了基于网络通信的“跨时空”双向信息传递。人们对于一个似乎能“连接万物”的新物种表现出了极高的好奇，几乎疯狂般地向互联网中发送信息，希望和虚拟世界中的一切建立联系。

不过，那时的网络通信技术有限制，无法像今天一样进行实时流媒体传输，“连接”的效率也有待提升。总的来看，这个阶段中人们对于互联网的态度，更多的是认为这是一个新的机遇，不断地向其中投入资本并产生各种信息数据，希望能借助于“互联网”这一物种产生经济回报，从而在真实世界中实现不同目标和追求。

Metaverse 0.3 版本：信息高频交互（2000s~至今）

当人们对互联网的使用日益增加，愈发地离不开基于互联网的应用，互联网本身也逐渐作为一种虚拟世界的基础设施存在于真实世界。通信技术的创新和进步也使得人们与虚拟世界发生交互的方式获得了提升，我们能够从虚拟世界中实时地获取高质量的各种流媒体，同时也开始向虚拟世界中贡献了爆发级别数量的信息。

由于虚拟世界的基础设施贡献，以及产生的各种内容，虚拟世界逐渐开始为真实世界提供价值反哺。在过去，虚拟世界创造价值的目的是为了让真实世界变得更好，但价值反哺意味着，真实世界产生的价值导向变成了让虚拟世界变得更好，也许是更加沉浸、更加自由、更加逼真或者更加与真实世界融合。

Metaverse 未来版本：虚拟信息反哺（未来）

在未来，随着我们对虚拟世界建设的不断增加，虚拟世界的基础设置将会愈发的完善，并会逐渐地展现出更高的支持效率。其中，内容的丰富度和供给效率将会变得远超我们想象，并且会以实时计算、实时生成、实时体验、实时反馈的方式提供，从而让我们认为虚拟世界和真实世界无差别。

在这个阶段，虚拟世界的经济体系已经“连通”，经济系统也已完善，同时伴随着对应的管理和治理结构，因此我们可认为这个阶段属于“元宇宙”的形态。同时，虚拟世界对真实世界的反哺也到达一个前所未有的高度，人们在真实世界中产生的价值，将会被大规模地投入到虚拟世界中，并更多地在虚拟世界完成经济和社会意义上的循环与迭代。

以上就是我们认为“元宇宙”发展的不同阶段的状态。需要再次说明和强调的是，“元宇宙”不会一夜之间出现，也不会是仅由一家公司打造和运行的，同时也许也不会有一个非常明确的节点或事件标志着正式的诞生和成熟。

自从人类历史上第一台电子计算机被发明出来，“元宇宙”就已经拉开了序幕。坦诚地说，目前我们尚未实现“元宇宙”，不过在技术驱动下的创新和迭代，我们实现了“元宇宙”的 0.3 版本。在未来我们将会持续地在虚拟世界中打造更加更富且有效率的信息交互内容和形式，以游戏为代表的泛娱乐场景、以电商为代表的消费场景、以社区为代表的社交场景等等，将会以新的方式进行重新组织并呈现。

与此同时，在未来为了支持并满足虚拟世界内更加大规模的内容供给，AI 一定且必须扮演更重要的角色：不仅是在基础设施层面实现更高的支持效率，更是在内容生成层面实现更真实的逻辑、更高的丰富度和更出色的还原度。

我们认为，虽然在真实世界中人类获取信息的 80% 以上是来源于视觉，图像端的信息的确能极大地丰富我们对于事物的感知；但我们更需要一种合理且有效的逻辑方式去处理并组织这些信息，从而帮助我们更高效地认知这个世界和我们自己，因此我们选择了在逻辑端进行探索与创新。

同时我们也非常激动能够看到有 Unity Engine、Unreal Engine、Nvidia 等公司在图像端不断地突破限制与发展，这是人类作为一个整体在对未来进行探索，共同实现“元宇宙”的愿景。

4. 光荣与梦想：通往云端物种之路

4.1 到太空去！到云端去！

这是一系列经久不衰的问题，也是作为人类这一物种我们需要去面对与思考的问题：我们的未来是什么样子的？我们会走向何处？我们会如何发展……

相对来说，如果采用一元论的视角去思考这种问题，其实并没有什么意义。对于二元论来说，这种观点认为世界的本原是意识和物质两个实体，试图调和唯物主义和唯心主义的哲学观点。它主张世界有精神和物质两个独立本原的哲学学说，同时也和一元论相对立。这种视角不仅脱胎于意识和物质的讨论，更是可以泛化到 Outside 和 Inside 导向的讨论。

人类有一个终极使命，即是生存与繁衍；为了完成使命，也有两个方向：“向外探索”与“向内探索”。“向外探索”代表着我们通过打造一系列的宇宙旅行载具和配套设施，不断地向外太空出发，在漫长的星际旅行中繁衍，寻找一个又一个适宜居住的星球。在此基础上，再建立类似于《质量效应》里的质量中继器作为星际穿越的跳板，进行快速且高效的探索。

来源于《质量效应》

事实上这一个导向的发展逻辑，人类再熟悉不过了，本质是通过技术的进步在真实世界探索可居住的地理区域，从而进行大规模的殖民、繁衍与社会性发展，最终成为星际物种。我们相信 Elon Musk 做了这样的选择，于是把移民火星作为一个发展节点，从而打造了 Space X 等一系列的“设施”。

不过，同样作为去火星，如果以“向内探索”的视角来看，我们完全可以将我们自己上传云端或者到芯片上，使用更加稳定的云端数据传输或者同样用飞船将芯片大批量送过去，再就地组装一个机械或者仿生躯干，是否会更加有效率一些呢？毕竟目前我们基于碳基的躯体还是非常脆弱的，也需要消耗非常多的资源和成本去维持其正常运转。虽然以地球生物的视角来看，碳基躯体是再合理不过的有效消耗载体；不过如果站在未来硅基时代（也许是这样）回头看现在，碳基的续航效率的确不足以支持人类大规模的迁徙。

严格来说，无论是成为星际物种还是云端物种，事实上这两种导向并不矛盾，甚至可以进行组合式发展。它们的核心关注点都是：如何能让人类有更高的概率在未来生存？这个问题事实上隐含了两个不同的条件，“作为现实世界的人类”和“作为虚拟世界的人类”会有不同的发展路径。

首先我们认为，随着“元宇宙”的出现，虚拟世界和真实世界的界限将会被逐渐模糊化，人们可以自由地选择生活的场所与场景。两个世界之间的基础设施是连通的，上一秒还处于云端化的人，下一秒就可以出现在真实世界的义体里。

不过很坦诚地说，我们当前距离真正的云端物种还有相当一段的距离，不仅是因为“元宇宙”本身的实现仍然需要非常多的技术进步和多个组织的共同努力，更是因为基础设施的进步有待提升。即使如此，人类也在“数字化”自身的道路上开始了一些令人兴奋的尝试。

2019 年 9 月 2 日，美国作家安德鲁·卡普兰成为了首个“数字人类”，他会将思想意识幻化成为世界上首个“数字人”，成为云端物种的先驱。他参与了 Nectome 公司的 HereAfter 计划，利用 AI 技术和相关硬件设备，在网络上实现“永生”。同时，他也将成为第一个数字人类“AndyBot”，而 Nectome 公司将以此为契机，持续进行以计算机模拟的形式复活人类大脑的工程。

虽然这一种“数字化”的方式不能算是真正的意识上传，但我们仍然看到了非常大的希望。前面提到过，我们的碳基躯体十分脆弱，以至于有时我们会认为我们赖以生存的氧气也许是一种慢性毒药，让细胞在快速的氧化反应中走向死亡。在生命科学领域有了一定的发展后，我们愈加感到生命是极为复杂的，要想让人类的碳基躯体永生，在目前看来几乎是不可能的。

正因如此，对“数字化生命”的创新与探索，成了人类追寻永生的另一条道路。以人工智能与信息网络技术支撑的数字化生命不再关心人类肉体，目前人们对于“云端物种”的尝试是用 AI 来保存并流传人类的思想和意识，从而把其一生中的所有经历与想法，包括声音、语言风格与行为模式都保存下来，并能通过 AI 与人们互动，做到一种 trade-off 式的生命延续。

不过就算我们真的上传了我们的意识和经验到了云端，这种方式仍然会面对一个问题：“我”不是我自己？或者说是一种类似于“特修斯之船”的命题。其内在的矛盾在于，当我们的意识被“数字化”后，我们如何确保上传后的意识是还是原来的那个意识？如果无法保证意识的一致性，那本质上来说，只是我们基于我们自身的数据打造了另一个在虚拟世界中生活的“数字人”。因此，我们需要强调“复制”和“上传”这两种行为的差异性，它们代表了完全不同的两种认知和路径。

4.2 “复制自己”与“上传自己”

“复制”这一过程代表着无差别且精确地呈现另一个完全一致的对象，因此会存在两个主体、两个意识等。客观地来说，对于具有海量信息的大脑, 如果想要实现 100% 的上传，需要精确到原子层面的信息复制，哪怕只扭曲与丢失 0.0001% 的数据，在云端复制出来的自己就不能称为“另一个”自己。因此以这种方式来说，人们普遍认为几乎不可能做到完全复制。

另外，基于当前的认知，我们知道“意识”是依附于生物大脑中的神经元而产生的。严格来说，我们暂时无法论证“意识”本身究竟是一个隔离的系统，还是和人身体的其他部位融为一体，同时彼此之间有大量的交互。换句话说，假如我们将“意识”上传到了云端，那这些云端意识和原生大脑中的意识，是否仍然是同一个“意识”？

来源于《上载新生》

从神经科学的角度来看，人的精神活动，如学习、记忆、意识等，大部分都是在大脑中发生的纯粹的电化学过程。著名神经科学家，美国艾伦脑科学研究所所长、首席科学家，Christof Koch 也提到过一种类似于机械论的描述：“意识是自然界的一部分，我们相信它仅建立在数学、逻辑和那些我们目前尚未理解透彻的物理学、化学和生物学中，而不是魔力或其他不属于我们世界的性质。”不仅如此，很多计算机科学家和神经科学家也认为，使用特定方式进行编程，计算机将拥有“思想”的能力甚至获得“意识”。

事实上，无论是“复制”与“上传”，这两个步骤都是在我们“提取”了大脑“意识”后的选择，简单来说，这两种方式一个是用来“创造另一个自己”，另一个是“让自己以另一种方式存在”。逻辑上来看，在这之前都需要将“意识”数据化。为了实现这个目标，有两个要素是非常关键的，一个是代表算力的“摩尔定律”，另一个是代表逻辑的“人脑建模”。

摩尔定律说的是：“当价格不变时，集成电路上可容纳的元器件的数目，约每隔 18-24 个月便会增加一倍，性能也将提升一倍”。人类在计算机上进行的任何操作，都会以二进制的方式被计算机储存、处理和输出，摩尔定律则代表大规模处理这种过程的能力。不过，随着晶体管的间距已经越来越接近 1nm，传统的技术接近其物理极限。当物体小到量子尺度，就会受到量子效应的影响，从而经典物理学将会失效，电子也不会按照物理规律移动。

在这样的预期下，量子计算被认为是延续摩尔定律的路径之一，也称为：量子摩尔定律。量子计算机是一种基于量子力学原理构建的计算机，核心是量子态叠加原理，它能够同时表示 0 和 1，在二进制规则的描述下，使得其算力发生爆发式增长，从而能在此基础上进行更加丰富的计算和模拟。

另一方面，根据神经科学的研究，人脑中大致包含 850 亿个神经元以及连接他们的 850 万亿个突触，用目前技术模拟其中任何一个都需要一台超级计算机；但考虑到计算机的电信号以光速传播，远大于人脑思考时的电化学信息传播速度，如果量子摩尔定理持续有效，那么在未来用一台超级计算机模拟大脑的运行是可行的。

来源于 QUANTUM COMPUTING FOR THEORETICAL NUCLEAR PHYSICS

为了“提取”大脑意识，我们需要考虑的另一个方面是“人脑建模”。事实上，也有两种路径去实现，一种是直接从生物层面去扫描、捕捉信号等方式获取信息后，通过对人脑功能的理解去建模；另一种则是通过 AI 去直接打造“数字化大脑”，设定相似的规则和约束，让这个“数字化大脑”在一次次迭代学习中破解我们的大脑运作方式。

以 AI 领域的视角来看，强化学习框架的突破的确为我们提供了这种可能性。从一开始 AlphaGo 的“单一目标”框架到混沌球的“多物体多目标”框架，机器在和自己一次次的博弈过程中，逐渐学会了学习的能力，使得其与人类大脑的学习和思考方式越来越相似。随着算力的不断增加和上升，AI 也逐渐地在很多细微的场景下展现出令人惊奇的潜力，这也给“人脑建模”这条路提供了相当多的希望。

5. 写在最后

我们对于世界的认知源于我们的感官，同时也受限于其中。基于目前的感官途径和认知，我们也许无法理解量子力学背后的原理，无法理解为什么无法超越光速，也无法理解这个世界背后的运转规则。背后的原因也许可以参考我们在创造虚拟世界时的对照，我们打造出来的角色他们的感知方式是被限定在对应规则中的，因此永远不具备上层世界的感知方式，所以无法窥探到如何跨越那个世界的方式。

类比我们自己，如果有一种方式能够打开人类的其他“感官”，我们就有可能接收到更多维度的信息，宗教里面的修行指的就是这个。多一个感知信息的维度和方式，我们就能获得超越当前维度的理解和规则。虽然人类大脑普遍无法理解高维空间，但给定数学规则的计算机总是可以计算出来的，也就是说计算机可以“理解”高维度。当人脑计算机结合时，也许就能理解更高维度的信息了。

当我们不断地以 AI 了解人类，对人脑建模并模拟其他部分时，其实我们也在逐渐地 AI 化。我们绞尽脑汁、呕心沥血地想去了解 AI 的黑箱时，AI 也在以他们的方式了解我们。到底是我们在研究 AI 还是 AI 在研究我们？也许未来机器会越来越像人类，人类也会越来越像 AI。我们相信人类未来的进化、社会未来的发展、虚拟世界未来的开拓、元宇宙的形成都一定会有 AI 的参与。

广义地来看，虚拟世界充满了“游戏”的特征，“元宇宙”的诞生更是需要非常多的公司、组织和个人共同参与才能实现。在未来，真实世界和虚拟世界的界限会非常模糊，在这个过程中，AI 也许能给我们提供新的感知维度和新的理解方式，从而让我们尝试突破物理的限制，找到一条最合适的发展路径。无论是“星际物种”还是“云端物种”，生命的存在本身就是一种神迹。如果把每一次完整的生命看作人类在“真实世界”中的一个训练轮次，从智人到现在的人类也就一万多个轮次，但我们已经进化到今天的样子。

有时我们也会猜测，冥冥之中是否会有一种“刻意”的引导才会进化得如此迅速，从而不由得常常抬头仰望璀璨的星空和浩瀚的宇宙。我们也始终相信，在好奇心和探索精神的驱使下，人类的未来充满了无限的可能；在漫长的宇宙史诗中，人类这一物种才刚刚走上舞台，属于我们的时代也正在开启。

来源于《2001 太空漫游》

宇宙的开辟，也许仅仅是为了让人类目睹而已。宇宙的无垠，只需寥寥数语就可诠释。人类单单只是存在着，就已经是一种稀缺之美。

本文来自微信公众号：rct studio，作者：张言、陈雨恒，制图：潇潇，rct 成立于 2018 年，Y Combinator W19 成员，汇聚了来自人工智能、游戏、设计和商业化等各领域的人才，致力于使用人工智能打造下一代交互式娱乐体验

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

机器学习、虚拟世界与元宇宙 Metaverse

最新评论

大 家 都 在 看

大 家 都 在 搜

大家都在看

大家都在搜