正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-05-08 09:20

AI解梦靠谱吗?

本文来自微信公众号:追问nextquestion (ID:gh_2414d982daee),作者:郭瑞东,审校:张心雨桐&存源,编辑:存源,原文标题:《AI解梦靠谱吗?学界目前进展如何?| 追问观察》,题图来自:视觉中国

文章摘要
本文介绍了AI解梦的研究现状和商业应用前景,包括通过脑电数据生成梦境图像、清醒梦引导技术等方面的进展。

• 💡 通过脑电数据生成梦境图像,探索梦境中的视觉特征表征

• 🧠 清醒梦引导技术的发展,帮助控制梦境产生

• 🚀 梦境解析对心理健康和创意生成的重要意义,展望未来技术应用的可能性

“庄周梦胡蝶,胡蝶为庄周。”纵观东西方历史,人类对梦境有着不约而同的执念。梦境也是神秘学的重要部分,常常与预知未来、认识自己等概念联系在一起。时至今日,人类一直试图解开梦境背后的意义,经常求助于各种解释方法,甚至发展出了许多流派。


的确,梦境提供了对我们潜意识深处的一瞥,揭示了隐藏的欲望、恐惧和情绪,对我们的现实生活也不无影响。随着大模型等技术的兴起,在GPT store等平台上,也出现了声称能够通过对话解析梦境的AI助手。


与民间占卜解梦不同,脑科学与梦境的相关研究首先关注的是梦境的内容,例如梦里看到的图像、听到的声音,之后才是梦境的意义。其研究对象也并非单个人的自述(轶事),而是一群人叙述的汇总及其中的统计规律。伴随技术进步,研究方法还包括了使用功能性磁共振成像(fMRI)等脑电检测,依据客观记录而不是主观描述来解析梦境。本文将从科学研究现状到商业应用前景,概述人们在“如何用AI作为工具指导人们更好地理解做梦”这件小事上做出的努力。


基于个人自述的梦境汇总,男生女生的梦有区别吗?


梦境的内容可归因于大脑对白天收集的信息的处理和整合,这便是美国心理学家卡尔文·霍尔(Calvin Hall)提出的延续假设(continuity hypothesis)。当我们睡眠时,我们的大脑通常会从之前的记忆、经历和情感中提取片段并拼贴成一个故事。这些神经活动的复杂相互作用产生了我们在梦中遇到的生动的、有时令人费解的场景和人物。


人的大脑就像一个专长蒙太奇的导演,它采用日常经历中看似无关的事件、人物和物体,并以只有潜意识才能理解的方式将它们组合在一起。在梦里,物理和逻辑定律被扭曲,产生了脱离现实引力的奇幻景象和意识流情节,让我们常常在第二天醒来后反复琢磨前一晚梦境的深意。


然而科学研究毕竟不是奇闻怪谈的收集,不论哪个学科,科研的第一步是建立基线,也就是理解大多数人的典型状况,以便在后续尝试理解个案时,能够有一个合适的锚点。2020年的一篇发表在皇家协会开放科学(Royal Society Open Science)的期刊上的研究[1],通过自然语言处理,分析了不同年龄和性别的24000个被试自述的梦境,构建了数据库Dream Bank。


研究发现,年龄,性别,过往经历(如是否当过兵)等不同因素都会对被试者的梦境产生影响(图2)该研究基于美国收集的数据,由于各国文化风俗上的差异,该研究的结论不适用于国内,但其研究思路是可以借鉴的。


▷图2.不同年龄的梦境报告中攻击性的等级从20世纪60年代到现在在逐步减少,这个趋势和美国的暴力犯罪统计数据相符。图源:参考文献[1]


除了统计性的群体描述,这类研究还让人们可以比较和自己处境相似的人会做什么样的梦。例如在dreamcatcher中,人们可以根据自身身份查看下图中的每一个叶子(点击后对应一个梦的描述),通过了解与自身处境相似的人做了什么梦,从而缓解因梦境引发的焦虑,也可以上传自身的梦境描述,丰富数据库的内容。


▷图3.基于自然语言处理的梦境解析和汇总网站dreamcatcher:https://social-dynamics.net/dreams/


基于Dream Bank数据库的衍生研究[2],还包括通过GPT模型分析梦境自述文本的困惑度(Preplexity,一个衡量文本意外程度的统计量)。以维基百科的文本作为基线,研究表明梦境中的文本并非人们之前预计的那样格外不可预测,两者困惑度接近。该研究的另一个发现也符合常识,即女性对梦的描述文本困惑度更高,组间差异更大,这意味着相比女性,男性的梦更容易预测。


▷图4.男性和女性梦境自述文本的困惑度对比,图源:参考文献[2]


科学家是如何读心的?


与上述依赖主观自述的研究不同,梦境可视化试图将人脑在潜意识或无意识状态下的内在认知活动转化为显性的图像或标签,例如做梦时看到了什么,听到了什么,有什么样的情感。这其中的研究,包括研究者要一次次将被试者从睡眠时唤醒,询问梦到了什么的实验,用以考察人们清醒后对梦的回忆。在这之中,又以清醒梦最为热门。所谓的“清醒梦”,可看成梦境与清醒的叠加态:做梦者有“正在做梦”的意识,并能描述出自己在做的梦。


梦境可视化的基础,首先是需要证明经由核磁共振成像,近红外线光谱仪及脑电图(EEG)等方法测量得到的大脑的血流,脑电及因工作而发热的变化模式,可被用以预测脑中的所思所想。19年的研究[3]根据人脑活动,复现了被试观察的影像。而23年的研究[4],基于Stable Diffusion,能够更准确地再现被试者脑中所看到的画面。


对比图5和图6,可以显著的看到重塑的图像更加准确了,那这性能进步的背后,是有哪些创新促成的?


▷图5.基于脑电MRI记录,实用深度神经网络重现被试观察到的图像。图源:参考文献[3]


▷图6.被试者看到的真实图片(第一行)和模型重构的图片对比。图源:参考文献[4]


对比2019年的研究与2023年的研究,最直观的区别在于2023年的研究增加了语义解码部分。不过在谈及这一点之前,先看看23年研究的图像解码是怎么做的。在大脑处理图像的过程中,像经过有损压缩后再放大的图片一样进行操作,脑中图像会先被压缩成基本的素描形式,保留关键信息,同时形式更简洁,便于管理。


这些压缩后的信息在大脑中是分布式存储的,这为科学家提供了解码的可能性。通过fMRI技术,科学家可以记录大脑活跃的部分,类似于观察一个拥有数万块硬盘的超级电脑处理特定数据时哪些硬盘处于工作状态,从而建立起一个基本的模型。


在解码大脑的实际操作中,基于fMRI数据,研究者首先根据大脑的信息压缩和分布式处理特点,构建了一个类似简笔画的初步图像。随后,在扩散过程中,模型会像绘画时一样逐步渲染上色,让图像逐渐丰富起来。然而,正如绘画时需要明确所画目标,重构大脑中想象的图像也需要利用大脑在观看图像后产生的语义信息,即大脑对图像的描述。


▷图7.研究5的模型框架示意图。图源:参考文献[4]


根据大脑的“语义地图”[5],被试在听到某些词汇时,相关的fMRI数据显示这些词汇在大脑周围分布,而没有一个明确的语言处理区域。与此同时,与意义相关的词汇在大脑中的分布更为集中。而研究[4],则将语义信号和视觉信号分别用不同的神经网络去处理,从而用解码的语义信息来帮助图像重建。


例如,当被试者看到的是一个狗的图画,但只基于视觉信号,重建的图像可能会缺少狗的典型特征,使得重建图像看起来更像是猫;而有了语义信息的帮助,解码系统发现观察到的词汇和骨头接近,于是在潜在扩散过程丰富简笔画的时候,就会选择突出那些狗的特征。这种结合了两种模型的图像重建方法,比单一依赖语义或视觉信息的方法,能够实现更清晰、更准确的图像还原。


▷图8. 由985个词构成的大脑语义地图。图源:参考文献[5]


▷图9. 对比被试看到的原图,以及只基于图像特征(第二列),只基于语义特征(第三列)以及基于两者(第四列)的效果图。图源:参考文献[4]


近年来,科学家通过类似的思路,可以基于脑电数据生成被试听到的声音信号[6],从而让失语者可以说出自己脑中所想的话。此外,当前还有研究能通过脑电信号解读出被试者默念的文本[7],并重建被试观看的短视频内的场景[8]所有这些研究,都说明了研究者目前有能力根据大脑活动读心。


但这距离解梦还有很长的距离。原因首先是梦境大多是迷幻的,跳跃的,人们会怀疑对梦境的描述更加没有逻辑,充满了离奇的意外(前述的基于梦境描述文本困惑度的[2],已提供了相反的证据);第二个原因,则在于很多梦境中包含了强烈的情绪,人们会担心梦境中强烈的情绪可能干扰其解读。


对此,24年的一项研究[9]声称可以结合个人叙事和fMRI,以此开发预测自发思维情感内容的模型,从而判断清醒梦中的主观体验是积极还是消极的。该预测模型不仅在阅读故事时能够预测被试的自我相关性和情感体验,同样适用于在自发思维(清醒梦)或休息状态下的199名参与者。


在这一研究中,研究人员监测参与者阅读故事时大脑活动,旨在解码思维的情感维度。为了捕捉各种思维模式,参与者参与了一对一访谈,以制作反映他们过去经历和情感的个性化叙事刺激。当参与者阅读他们的故事时,其大脑活动在MRI扫描仪内被记录。在fMRI扫描后,参与者再次阅读故事,并报告每个时刻感知到的自我相关性(即这些内容与他们的相关程度)和情感(即这些内容是积极还是消极)。使用每个参与者的自我相关性和情感评分的五分位数,研究团队创建了25个不同的情感和自我相关性组合,使用机器学习技术结合这些数据及49名参与者的fMRI数据来实时解码思维的情感维度。


研究发现前扣带回皮层和岛叶前部等关键大脑区域在预测个人相关性和情感调子方面至关重要。通过解码与具体情节无关的情感,该研究有助于我们理解影响主观体验的内部状态和背景,可能有助于揭示思维和情感方面的个体差异,并有助于评估心理健康。


梦境可视化的现实与理想


前述的研究都还没有直接涉及对做梦时大脑的解析,只是试图对清醒状态(或清醒梦)下受试者的所思所见进行预测。然而,有研究开始直接探索梦境中大脑的活动,并尝试将梦中的图像可视化。


例如,研究[10]依据两名受试者在fMRI下的大脑活动数据和他们自述的梦境内容,揭示了大脑在梦境中的图像处理具有层次化特点,即做梦时会激活与梦到物体相关的分层视觉特征表征。研究表明,从自己做梦时大脑活动中解码的特征值与梦中物体类别相关的特征值,在在中间到高级深度神经网络中表现出正相关。


这不仅提高了区分梦中物体类别的准确性,而且表明梦境中的视觉特征表征与清醒时的视觉处理相似,意味着大脑在做梦时可能和清醒时使用相同的机制,这支持了通用解码方法在不同视觉体验(清醒和梦境)中的泛化能力,从而论证了梦境解析的可行性。


▷图10.单次实验中,针对梦境在出现图片的预测,可基于较高抽象层级的特征得出。图源:参考文献[10]


早在2013年,研究[11]在视觉皮层区域刺激诱导的脑活动上训练的解码模型,显示出模型对梦境内容的分类能力超过随机猜测。在这项研究中,三名受试者在进行磁共振睡眠实验时,每当脑电信号被检测到,他们便被唤醒,并描述醒来前的视觉体验。为了收集充分的数据,每位受试者平均每5-6分钟就被唤醒一次,主要关注人们刚入睡阶段产生的类梦境视觉感受。在超过75%的唤醒中,受试者报告了梦中的内容。预测模型试图区分受试者梦见的是人还是椅子等物体,并在解码器的输出中使用了多个标签来提升准确性。这距离上文所讲的解码梦境中的所思所想,还相距甚远。


21年来自清华大学未来实验室的研究[12],基于11名被试者REM睡眠期的EEG数据,结合心理问卷帮助评估情绪,最终生成了梦境的抽象视觉表述。图11展示了基于EEG产生的对梦境的艺术化展示,该例中梦境的情感关键词是如释重负(relieved)。这项研究进一步说明了当前对梦境的解读,还远远做不到“像素级”的准确度,只是能够对情感进行定性的含糊描述,或者对梦境中出现的物体生成有一个比随机更准确的有根据猜测。


▷图11.基于EEG数据对梦境中的情感产生的艺术化表征。图源:参考文献[12]


然而,前文关于清醒时大脑解析的研究,以及梦境和大脑遵循相同神经机制的研究,共同说明了梦境解析具有技术可行性,只是目前受限于当前研究条件(例如fMRI的机器噪音,实验成本,受试者过少等技术因素)还不够成熟。未来随着技术的进步,有着巨大的潜力。且梦境可视化这项技术在心理健康领域的应用具有重要意义。对梦境的理解可能带来新的治疗方法,特别是创伤后应激障碍(PTSD)、抑郁症和焦虑症等疾病。


除了心理干预,对梦境的重现还可以用于创意生成。应用创意设计等方式对梦境中的内容进行重构,可以产生更有艺术创造力的内容。此外,在科学史中,凯库勒在梦中找到了苯环的结构,门捷列夫在梦中产生了元素周期表的概念,我们不知道有多少科学上的创意,出现又无声的消失在梦中,通过对梦境的记录和解读,我们未来也许能够捡起更多这样带有科学创新点的梦。


总的来说,EEG和fMRI已经将梦境分析从纯粹的猜测转变为实证科学探索,从而得以让我们更加接近揭示梦境的真相的那一天。


梦境解析和引导的商业应用


说起解梦,人们最熟悉的是弗洛伊德-荣格的精神分析学派。虽然这一派的理论广为人知,但学术界对其有效性存在争议。随着大模型及对应智能体的成熟,市面上出现了不少号称可以解梦的聊天机器人,但这样的机器人带给笔者的个人体验并没有多么惊艳。更有一些解梦的应用,宣称结合中医典籍,对于这样有“伪科学”嫌疑的研究,读者更应该批判性地审视,不能因为大模型的套皮而轻信。


除了就梦境内容展开对话,基于梦境和AI结合还可以考虑梦境记录方面的应用。考虑到我们对梦境的记录往往出现在刚睡醒或半睡半醒间,并且很大比例的梦境会在我们醒来后消失,一个记录工具显得尤为重要。苹果平台的PlotPilot[13]可记录使用者对梦境的语音描述,并通过AI文本分析配上属于对应的背景音乐,制作成专属的有声书(现在可以根据梦境描述产生视频)。这样的工具不仅能帮助用户更好地了解自身潜意识的心理需求,还可以促进对梦境的研究。


如果说根据脑电活动预测个人的所思所想,会让人想到许多科幻小说里的场景,那么能帮助用户进入且稳定在清醒梦中的工具,则充满了《盗梦空间》的意味。2024年1月,美国初创公司“Prophetic”开发了一款名为“Morpheus-1”的新型人工智能模型,该模型可以以大脑的脑电活动作为提示词,基于多模态大模型生成与该大脑状态相互作用的形状声波。


据称,输出的声波可与Prophetic计划明年春季发布的一款新头带产品“The Halo”绑定。The Halo会发送声波进入大脑,与当前的大脑状态相连接,从而使心灵进入清醒状态。据Prophetic称:“引导产生的清醒梦是一种梦者意识到自己正在睡觉的梦。”而公司设想的产品则可以让用户有效控制自己的梦境。


由于该公司成立不久,宣传的产品还没有发布,其技术的实际能力还有待进一步观察。一旦成功,此举对学界和市场都有重要的意义,引导清醒梦将有助于减少PTSD等心理疾病引发的噩梦,促进正念,为意识的神秘本质打开新的窗口。


另一方面,无论是引导还是预测梦境,这些涉及个人私人体验的应用无疑将产生大量敏感的数据。如何避免这样的技术被滥用?消费者需要提前意识到技术的双刃剑性质,有保护自身的权利和隐私的意识。在技术成熟前,不妨先通过科幻小说进行思想实验,模拟各种情况下新技术产品的推动可能对社会造成的影响:例如,如果未来的打工人要通过清醒梦来证明自己对企业的忠诚,多疑的伴侣可以偷偷记录并解析枕边人的梦境以查找出轨的证据时,社会又将成为什么样?


小结


“Life is but a dream......”


从弗洛伊德和荣格的心理学,到最新的基于脑电的读心术,以及基于大模型的海量梦境自述的文本分析,我们对大脑的理解,正在从定性转为定量,从个体案例转为群体统计,从依赖主观描述转为客观数据。随着对梦境产生机制的了解,人们也能够逐渐去控制梦的产生,从而避免或减少噩梦的出现,甚至引导清醒梦的产生。


同时,随着人们对梦境的测量和控制手段的进步,研究者得以用科学的方式去尝试回答更多之前无法解答的问题,如梦境中的情感体验究竟是什么样的?动物们在做梦时想到了什么场景?AI是否具有做梦的能力?知识带来新的技术应用,而新技术扩展了可触及知识的边界。对梦境的研究,一旦脱离了民科和伪科学,就将踏上科学界通用的正向飞轮。


参考文献:

[1] Fogli, Alessandro, et al. “Our Dreams, Our Selves: Automatic Analysis of Dream Reports.” Royal Society Open Science, vol. 7, no. 8, 26 Aug. 2020,  https://doi.org/10.1098/rsos.192080.‌

[2] Bertolini, Lorenzo. Dreams Are More “Predictable” than You Think.‌

[3] Shen, Guohua, et al. “Deep Image Reconstruction from Human Brain Activity.” PLOS Computational Biology, vol. 15, no. 1, 14 Jan. 2019, p. e1006633, https://doi.org/10.1371/journal.pcbi.1006633.‌

[4] Takagi, Yu, and Shinji Nishimoto. High-Resolution Image Reconstruction with Latent Diffusion Models from Human Brain Activity.‌

[5] Huth, A.G., de Heer, W.A., Griffiths, T.L., Theunissen, F.E., Gallant, J.L., 2016. Natural speech reveals the semantic maps that tile human cerebral cortex. Nature 532, 453–458. doi:10.1038/nature17637

[6] Chen, Xupeng, et al. “A Neural Speech Decoding Framework Leveraging Deep Learning and Speech Synthesis.” Nature Machine Intelligence, vol. 6, no. 4, 1 Apr. 2024, pp. 467–480,  https://doi.org/10.1038/s42256-024-00824-8.

[7] Duan, Yiqun, et al. DeWave: Discrete EEG Waves Encoding for Brain Dynamics to Text Translation.

[8] Chen, Zijiao, et al. Cinematic Mindscapes: High-Quality Video Reconstruction from Brain Activity.

[9] Hong Ji Kim, et al. “Brain Decoding of Spontaneous Thought: Predictive Modeling of Self-Relevance and Valence Using Personal Narratives.” Proceedings of the National Academy of Sciences of the United States of America, vol. 121, no. 14, 28 Mar. 2024, https://doi.org/10.1073/pnas.2401959121. ‌

[10] Horikawa, Tomoyasu, and Yukiyasu Kamitani. “Hierarchical Neural Representation of Dreamed Objects Revealed by Brain Decoding with Deep Neural Network Features.” Frontiers in Computational Neuroscience, vol. 11, 31 Jan. 2017, www.frontiersin.org/articles/10.3389/fncom.2017.00004/full, https://doi.org/10.3389/fncom.2017.00004. Accessed 26 Nov. 2019.

‌[11] Horikawa, T., et al. “Neural Decoding of Visual Imagery during Sleep.” Science, vol. 340, no. 6132, 4 Apr. 2013, pp. 639–642, science.sciencemag.org/content/340/6132/639.full, https://doi.org/10.1126/science.1234330.

[12] Chen, Yunbing, et al. EEG Based Artistic Visualization of Dreams. 16 Oct. 2021, https://doi.org/10.1145/3490355.3490376. Accessed 4 Oct. 2023.‌

[13] https://medium.com/@plotpilot/how-people-are-re-experiencing-last-nights-dreams-with-generative-ai-4e5a136d63b6


本文来自微信公众号:追问nextquestion (ID:gh_2414d982daee),作者:郭瑞东,审校:张心雨桐&存源,编辑:存源

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: