扫码打开虎嗅APP
本文来自微信公众号:神经现实 (ID:neureality),作者:Dan Robitzski,译者:范范,校对:胡夏天,编辑:eggriel、M.W. ,头图来自:视觉中国
在最近的一项研究中,实验猴面对无解之谜表现出了不可动摇的决心:即便奖励的发放规律随机,或与它们认定的规律相左,它们仍会自信地认为自己的猜测才是正解。简而言之,猴子通过虚假学习(spurious learning)获得的信念——即坚定地认为实际上无解的谜题一定有结构可循且有正确答案——甚至超过了对得到最多奖励的欲望。
这项8月23日发表于PNAS的研究表明,猴子可以对如何解决谜题或如何完成任务,建立内部的表征与假设;这一构建甚至会取代一般实验行为背后的诱因,比如奖励。而且,就算这些动物拿到的谜题是无解的,这种心理构建也会让它们继续试着解题。它们坚持的程度和时长远超哥伦比亚大学研究者们的预测。该研究表明,猴子并没有区分可习得的和不可习得的任务的能力,它们会用完全一致的方式对待两者。研究者们说,这正如人类在对待随机的或不可达成的挑战时倾向于采取的方式。
论文题目:Superstitious learning of abstract order from random reinforcement
DOI:https://doi.org/10.1073/pnas.2202789119
论文的作者之一、哥伦比亚大学神经科学家杰奎琳·戈特利布(Jacqueline Gottlieb)解释道,该研究最初的目的是了解学习和探索背后的动机。“探索的主要回报是找到这个世界的某种结构或规律。可问题是,我们生活在一个非常复杂的世界:这其中,许多事物的规律也许成立,但也有许多事物毫无规律可循。”
在这项研究中,首先,两只恒河猴(Macaca mulatta)被训练解决以下问题:每一组题目包含被排序好的五个图像刺激,触摸屏上每次显示两张图像,它们需选择其中任意一张(并通过实验者的反馈)判断哪一张在排序中更靠前,从而通过试错推断出五张图像的正确顺序。在训练阶段,这些图像的确有固定且可习得的出现顺序,而被限水的猴子如果回答正确就可以得到一口水的奖励。
尽管每一组题目中的图像都会变化,但经验似乎告诉猴子们:这个任务是有潜在结构的——这是它们一直坚信的假设,即使那些有解的问题后来被换成了无解的问题。
除此之外,在后面的任务中,饮水奖励并不是根据回答是否正确而给出的(因为根本没有正确答案),而先是随机分发、然后以一种鼓励猴子改变答案的方式给出。文章作者之一、哥伦比亚大学灵长类动物认知学研究者格雷格·詹森(Greg Jensen)对《科学家》杂志说:“我们已经否定了它们脑海中一致且自洽的逻辑结构。”但在这些实验中,就算会得到更少的回报,猴子仍旧按照“问题可解”的思路继续,给出了一以贯之的答案。此时,实验员加入了第三只在训练阶段花了较少时间的猴子,想看看结果是否会有所偏差,但它也表现出了相似的行为,给出了三只猴子中一致性第二高的作答。
“作为动物,我们希望这个世界是有规律的;我们希望能够学习我们身处的环境。”虽并未参与此研究,但研究学习与记忆的娜塔莉·奥迪诺奇(Natalie Odynocki)通过电邮告诉《科学家》杂志,这种情况下,“这些猴子将他们习得并从中获得了奖励的规律应用到了新的情景中。”
想象不存在的结构
戈特利布说,她本以为这些动物会紧密关注自己的学习效率,即根据收到奖励的频率来判断它们的表现。但实际上,它们似乎构建了一种内在的奖励(机制),让它们专注于解题,而不是赢得游戏的奖励。“相信有一个规律存在,并相信自己很快就要找到这种规律,是非常有激励性的。”她说。
人类身上也曾发现类似的现象。比如,在戈特利布和她的同事去年发表于《自然-通讯》杂志的一项研究*中,被试们尝试解出一个同样无解的题目(混杂于三个可解决的题目中)。据戈特利布说,许多人沉浸在对无解题的挑战中,甚至有一些人扬言,只要有更多的时间他们就可以解出来。而在此新研究中,研究者们也比较了猴子和那些坚信自己会赢的赌徒的行为,以及那些体育迷们在没有任何相关数据的情况下预测比赛赢家的行为。
*译者注
Ten, A., Kaushik, P., Oudeyer, PY. et al. Humans monitor learning progress in curiosity-driven exploration. Nat Commun 12, 5972 (2021).
https://doi.org/10.1038/s41467-021-26196-w
“我们得出的结论是,学习是一件复杂的事情。而且如果你开始就抱着(某任务)是有结构的信念,你就可以说服自己你正在学习这个结构。”戈特利布说。“你可以只听从内心的暗示,或猴子完成任务时利用的东西——无论那是什么,无视外部奖励的暗示,并把这当作学习。”
“当看到随机输入得到了非常稳定的输出时,我们真的很意外。”共同作者、哥伦比亚大学的文森特·费雷拉说。
耶尔·尼夫(Yael Niv)却并不觉得意外。她是普林斯顿大学的一名未参与此项研究的神经科学家。她说,大脑有一个寻找规律和结构的倾向,即便规律性和结构性并不真的存在。“一个(试图解释这种情况的)观点是,为了理解这个世界中真实的关联,我们必须先假定它们存在。”她通过电邮告诉《科学家》杂志。“这意味着我们必须有一种预设:即使我们还没有从数据中看到证据,但有种关联可以让我们发现。”
詹森告诉《科学家》杂志,实验中的任务很可能利用了一个可以帮助动物迅速决定顺序或排名(比如社会阶层)的机制。他补充道,这个机制存在于许多不同的生物种类中,即使是黄蜂也可以正确地对五个物体排序。詹森表示,有些学习与记忆的研究者没能考虑到动物被试和人类被试同有的这种偏向,这可能就会导致问题,这就突显出了那些深思熟虑而得的控制实验组的价值。“一旦涉及到有些更加复杂的任务,一个控制条件真正意味着什么可以是非常微妙的。”詹森说。
奥迪诺奇表示,猴子这么我行我素也可能是因为实验任务和训练任务过于相似了。“如果实验刺激有更明显的区别,也许它们会采取新的行为方式,行为的泛化也会更少。”她说,“动物喜欢可预测性。”而刻意忘记一个在过去曾对它们有用的行为可能需要很多时间。
奥迪诺奇还表示,如果猴子的奖励是食物而不是水,结果可能也会不同,因为它们对于要寻找额外的奖赏而非生存必需品的行为也许会不同。
本文来自微信公众号:神经现实 (ID:neureality),作者:Dan Robitzski,译者:范范