扫码打开虎嗅APP
“现在在南方和北方生活的人群,他们的遗传成分是不一样的。我就很好奇,他们的这种差异和分化,是从什么时候开始的呢?这种差异和分化与我们文明的发展又有什么联系?所以我们把时间追溯到过去的中国南北方人群,首次开展了时间跨度最大的、系统性的古基因组研究。” 本文来自微信公众号:一席(ID:yixiclub),主讲人:付巧妹(古遗传学家,中科院古脊椎所古DNA实验室主任),原标题:《我们紧接着又提了个问题:我们更像古南方人还是古北方人呢?| 付巧妹 一席第769位讲者》,题图来自:IC photo
寻踪东亚
2020.06.06 北京
大家好,我叫付巧妹,很荣幸来到一席。以前我讲的比较多的,是欧亚大陆上万年以前的早期现代人,今天我会聚焦东亚,向大家介绍我们近几年的一些研究。可能相对前面几位讲者,我的研究会比较难懂,我会尽力讲好,如果有讲得不好的地方,请大家多多谅解。
古DNA到底研究些什么?
人类演化中有许多未解之谜。在Science杂志创刊125周年的时候,他们曾经公布了125个最具挑战性的科学问题,其中有几个就与人类演化有关。比如:
我们所研究的古DNA领域,就试图去回答这样的问题。通过古DNA,通过古代生物的遗骸或者遗迹中残存的极其微量的DNA片段,我们可以直接研究过去人群的遗传信息,获取以往研究无法获取的重要信息。
已有研究告诉我们,在过去,现代人的祖先曾经与不同的已灭绝的古人类共存过。所以古DNA研究最关注的就是两个问题:
大家可能对我说的“灭绝古人类”和“现代人”没有太多概念。
灭绝古人类,顾名思义,现在已经没有后代了,他的体质特征跟我们现代人是不一样的,比如尼安德特人平均颅容量大于现代人,眉脊明显,额头平扁;他们的骨骼强健,四肢粗短,手和脚也比较大。大概12万年前开始,他们生活在欧洲、亚洲西部、非洲北部,在约三万年前消失了。
而现代人的祖先,早期现代人,也可以称为解剖学意义上的现代人,与我们现在生活着的现代人,在体质特征上已经没有明显的区别了。他们早在20万年前就已经出现。
▲ 左:尼安德特人 右:早期现代人
在他们共存的时间里,灭绝古人类跟早期现代人是如何互动的,甚至他们之间是不是有过互动?这些问题其实一直有很多争议,直到2010年前后我们才有了一些答案。
灭绝古人类与早期现代人是否有过互动?
2010年,通过人类古基因组的证据我们了解到,非洲以外大多数现代人的基因,至少1%至4%源自尼安德特人,也就是说欧亚大陆上的现代人群都受到他们基因的影响。
2014年,我主要主导研究的从西伯利亚西部发现的、约4.5万年前的人类化石中,获取到了目前最古老的现代人基因组序列。确定了早在4.5万年前,这个现代人个体的祖先就和尼安德特人存在过基因交流,而且估算交流的时间大概发生在距今5万年到6万年前。
随后更多的研究显示,灭绝古人类跟我们现代人发生了不止一次混血,而且更有意思的是,反过来我们现代人对尼安德特人也有基因上的影响。
在2018年的时候科学家还发现了一个母亲是尼安德特人,父亲是丹尼索瓦人的混血儿。
这些研究让我们对现代人的演化有了更多了解。不过,不知道大家有没有发现,过去的这些研究,主要是针对欧洲和北亚人群。事实上到2017年为止,有关东亚的、尤其是有关中国的人类古基因组研究是非常非常匮乏的。我当时的梦想,就是希望能够了解我们东亚自己的事情。所以我这几年的研究主要聚焦在东亚。
为什么获得古DNA这么难?
首先要向大家介绍的,就是我们关于田园洞人的研究。大家可能对山顶洞人会更熟悉,田园洞人其实和山顶洞人一样,都是在北京房山地区发现的。但他们存在的时间比山顶洞人还要早,大概在4万年前左右。
▲ 田园洞
田园洞人和山顶洞人都是早期现代人,因为历史的原因,山顶洞人相关的头骨材料遗失了,所以更显得田园洞人骨骼材料的珍贵。我们从田园洞人的腿骨上提取到了目前为止东亚最古老的人类基因组,而且它也是我们中国第一例人类古基因组。
其实早在2003年,田园洞洞穴地层中就已经发现了化石,但直到2017年我们才获得了基因组,为什么获得古DNA会这么难呢?
首先我想让大家了解一下古DNA是什么。古DNA没有一个绝对的定义,骨骼、土壤……只要能承载遗传信息,都可以成为我们研究的对象。
上世纪80年代起,其实就已经有古DNA相关的研究,比如说人们在琥珀、在恐龙蛋中都发现了遗传物质,但到后来发现这些遗传物质实际上都来源于污染。
为什么会这样?这与古DNA的特点有关。古DNA跟“新鲜”的DNA非常不一样,它掺杂了大量微生物的DNA等等污染,属于这个个体本身的DNA非常少,有时候甚至是没有。
对于古DNA研究而言,我们需要找到的是属于这个个体的内源DNA,所以即使是触摸样品这样简单的举动,都会对结果产生非常大的影响,甚至导致整个研究的失败。因为你获得的,有可能都是来自于这些摸过化石的人的DNA,而不是属于这个样品本身的。
所以这也就是为什么,古DNA在过去很长时间里,一直都很难被用来研究人类的演化。直到过去十年以来,技术才开始有了突破。我就非常有幸和同事共同开发了一种新的技术,像“钓鱼”一样,即使在一些微生物污染非常严重的情况下,我们也可以提取捕获微量的内源古DNA。
怎么“钓鱼”呢?我们用现代人的DNA,做了一个像吸铁石一样的引子,这个引子可以将仅占0.03%的人类DNA,从大量来自土壤微生物的DNA中吸附、富集并“钓取”出来。
通过这种方法,最终我们成功提取了4万年前田园洞人的基因组。这个技术在全世界的影响可以说是非常大的,因为我们就能够用这种方法,去研究一些过去很难获得古DNA的样品,从而扩大研究对象的范围。
北京田园洞人与亚马逊原住民
那么田园洞人的基因组到底告诉了我们些什么呢?田园洞在北京房山,大家可能觉得,那他肯定是一个东亚人。但事实上,要搞清楚这个问题是非常不容易的,因为他不一定留下了后代,不一定是我们遗传意义上认为的东亚人。
这张树状图可以看出田园洞人与不同地区人群的遗传关系。通过很多研究,我们明确看到田园洞已经是遗传意义上的东亚人了。但这个研究没有结束,我们发现了一个特别有意思的现象:他们和古欧洲人群,甚至与美洲原住民人群之间存在不寻常的联系。
你可以看到,就在欧洲这个区域,跳出来了一个红色样品,它属于距今三万五千年的比利时的一个个体。神奇的是,这个个体相对于别的欧洲人而言,跟田园洞人遗传关系更近。
这说明了什么?说明早期欧洲人和亚洲人,遗传上并不是简单决然地分开的,他们之间存在一种联系。而且这种联系,是因为更古老的人群间接地对他们共同产生了影响,他们体内都残存着来自于古老人群的成分,把他们联系起来。
更有意思的是,我们可以在树状图中看到,田园洞人相关人群不仅是东亚人、美洲原住民共同的祖先,而且相对于别的地区的美洲原住民而言,竟然与亚马逊地区的原住民在遗传关系上距离更近。
这意味着什么呢?这种不均等的特殊联系说明,在东亚史前时期,人群的迁移交流是非常复杂的,这也让我们更加迫切地想要研究中国不同时期和不同区域的人群的多样性。这个研究在当时被Science杂志认为“填补了东亚非常重要的地理和时间尺度上的巨大空白”。
还有个有趣的现象,那就是田园洞人虽然生活在现在的北京地区,但是相对东亚南方人群而言,他并没有跟北方人群显现出更近的遗传联系。这说明田园洞人处于东亚南北方人群分离之前,是古老的东亚人群。
我为什么会开始研究南北方古人群?
讲到南北方人群,与大家分享一个我们有意思的研究。
我们现在知道,东亚南北方人群有很多差异,比如生活习惯上的差异。我是南方人,我还记得我刚上大学的时候,去了北方,第一次吃豆腐脑就很诧异,怎么会没有糖,怎么只吃这种咸豆腐脑?
那么除了外在的差异,南北方人在遗传上有没有差异呢?带着这个问题,我们开始把研究聚焦在南北方人群。但这个“南北方”可能和大家想象的有所不同。
我们现在常说的南北方人,经过不断迁徙融合,很难选出具有代表性的研究对象,所以我们选择的是长期定居在南北方的少数民族人群,以他们的基因作为一个参照,比如北方的达斡尔族、赫哲族、锡伯族、蒙古族和南方的阿美族、泰雅族、布农族、傣族。他们流动相对少,相对而言更具有代表性。
图中可以看到,现在在南方和北方生活的人群,他们的遗传成分是不一样的。我就很好奇,他们的这种差异和分化,是从什么时候开始的呢?这种差异和分化与我们文明的发展又有什么联系?
所以我们把时间追溯到过去的中国南北方人群,首次开展了时间跨度最大的、系统性的古基因组研究。今天就与大家分享其中几个有意思的发现。
4年时间,寻找南方人的古DNA
其实从2012年开始,我就一直有做这个研究的设想,到2014年的时候,我们已经做出了几个关键样品的基因组,也得到了一些很重要的结论。但当时我很纠结一点,就是其中一个基因组是不是能够真正代表南方。
这个基因组来自亮岛,它是离福州很近的一个岛屿。让我最纠结的原因就在于,岛屿是一个非常特殊的环境,岛屿上的人群和邻近的大陆人群可能也会存在很大差异。
比如印度安达曼群岛上生活着一个现代人群,叫翁奇人,他们过着狩猎采集的生活,人口只有不到100人。由于地理的隔离,他们与印度半岛大陆上的其他人群遗传差异很大。所以亮岛岛屿上的人群有可能无法代表典型的南方大陆人群。因此我很希望通过我们的努力,能够获得更具代表性的南方大陆人群基因组。
这个花的时间就非常长了,我们花了四到五年的时间才真正地做出了南方人群的古DNA。为什么会这样?第一个原因刚刚也提到过,就是样品中常常有大量微生物DNA的污染,让你很难获得这个个体的内源DNA。
另外一点就是,南方地区潮湿炎热的气候和酸性的土壤环境,非常不利于样品和样品中DNA的保存,人类DNA容易被高度甚至完全降解。在这种情况下获得基因组的难度是非常大的。
2014到2018年的这四年里,我们付出了非常多的努力,深入南方30多个遗址采集了257例古代人类样本,目前为止已经获得了18个南方个体的基因组。
这些基因组非常珍贵,最早的属于新石器早期,时间跨度非常大。整个研究的样品分布在北方的山东、内蒙古,南方的福建及临近岛屿等11个遗址,包括了25个9500年到4200年前和一个300年前个体的基因组。
南北人群的分化是从什么时候开始的?
这些基因组到底告诉了我们哪些信息呢?通过对比古南北方人群的基因组,我们发现,早在9500年以前,南方人群和北方人群就已经出现分化。
我们马上就会想提出第二个问题,与今天的现代人相比,南北方人群差异是更大了,还是更小了?我们发现,古南北方人群的差异,远比现今南北方人群的差异要大。这说明什么?说明近万年以来,南北方人群其实是在不断融合的。
而且这个融合发生的时间远比大家想象的早。通过研究可以看到,大概在8000多年前,在北方山东人群的基因组中,就已经发现了古南方人群的成分;同样地,在8000多年前的南方人群基因组中,也发现了北方人群的信号。
这说明至少在8000多年前开始,甚至在更早的时候开始,南方人和北方人就已经有互动了。而且很有意思的是,直到4000多年前,这种互动仍然存在,这种影响依然是双向的。
我们更像古南方人,还是古北方人?
紧接着我们就又提了一个问题:虽然南北方人群互相有影响,但这种互动和影响是均等的吗?南方人群对北方人群影响更大,还是相反呢?通过研究我们发现,在9500多年到7500多年前,在这个阶段可以明显地看到,古南方人群主导着南方,古北方人群主导着北方,直到4000多年前的时候也基本如此。
但有意思的是,当我们观察现在的现代人基因组,会发现,古南方人群成分在我们基因组中的比例下降非常多,可以说,在现在的东亚内陆人群的基因组中,古北方人群成分是占据主导的。
所以我们可以推测,南北古人群虽然一直在交融和互相影响,但在新石器时期之后,可能出现了大量黄河流域人群向南迁徙的现象。这构成了现在中国南北方人群的基本框架。
与欧洲人群截然不同的演化历程
这个研究有什么意义呢?它既是对华夏文明本身的溯源,也反映了一个非常有意思的现象,就是东亚与欧洲同一时期的人类演化历程是截然不同的。
同样在大概9000多年前,近东的农业进入欧洲,对当地人群的生活方式产生了很大的影响,人们逐渐从狩猎采集的生活转向农耕生活。
在这里可以看到三个人群,狩猎采集者、早期农耕者以及现代欧洲人。通过比较可以看到,当地人群的基因组成分发生了变化。属于狩猎采集者的绿色特征占比变少,而属于农耕者的红色特征占比逐渐增大,这说明,农业带来的不光是技术的传播,还带来了新的人群的进入。
在这里就要提出一个重要的问题了:农耕人群的进入是取代了当地人,还是与当地人进行了融合?在研究人类演化的时候,取代还是融合,始终是一个非常重要的问题。
通过研究我们发现,对于狩猎采集人群来说,他们的数量并没有出现一个急剧下降的过程,同时,在外来的农耕人群中,出现了早期人口的膨胀。这说明新的人群与本地人群之间,并不是取代关系,而是一个同化的过程。
所以我们可以说,在约9000年前农业出现以来,欧洲人群不断受到近东农业人群,以及受到欧亚草原人群等外来群体的大换血。外来人群一直在重构欧洲人群遗传信息,对现今的欧洲人产生了重要的影响。
而在中国,南北方人群虽然早在9500年前就已经分化了,但南、北方同期人群的演化基本是连续的,没有明显受到大量外来人群的影响,迁徙互动主要发生在东亚区域内的各种人群之间。
还有一个有意思的现象。最开始的时候我有提到,我们研究中现在的南北方人主要指少数民族。那中国各个地区的汉族人的遗传成分是什么样的呢?我们发现,现在大部分汉族人群所携带的东亚古南北方人群成分的混合比例基本相似,这也是晚期人群不断融合的结果。
南岛语系人群的起源之谜
所以南北古人群的基因组研究,展现了南北古人群迁移和融合的过程,也告诉了我们中国人群与欧洲人群截然不同的演化历程。除此以外,它明确了非常重要的一个信息,就是南岛语系人群的起源地。
可能有些人对南岛语系不是太了解。南岛语系是现在世界上唯一主要分布在岛屿上的一个语系,包括大概1300种语言。南岛语系人群就是指使用这些语言的人群,他们主要生活在太平洋岛屿,在南方大陆没有分布。
过去,现代遗传学和考古学对南岛语系人群的起源进行了很多研究,但是一直没有定论。有人认为南岛语系人群是在台湾岛起源的,因为有一些语言和遗传上的证据,但还有些人认为,他们是在南方大陆起源的。
长期以来,这些争议一直都存在,从来没有一个确凿的证据能让所有人信服。今年,我们的研究对此得到了一个突破性的进展。我们做出了几个非常关键的基因组,一个是在福建发现的8000多年前的奇和洞人基因组,和4000多年前同样在福建生活的人群的基因组。
在遗传上,他们都跟南岛语系人群直接相关。
这张图可能大家不一定能完全看明白,但它非常明确地展示了他们基因之间的联系:不管是早期还是晚期的南方人群,他们跟太平洋岛屿上的典型的南岛语系人群的基因是“聚”在一起的,也就是说他们是直接相关的。
奇和洞人的基因信息起到了非常关键性的作用,因为他的基因组告诉我们,比起现在分布在内陆的南方人群(例如:傣族),福建奇和洞人与分布在台湾岛的阿美族具有更强的遗传联系。
所以通过我们的研究,我们确认南岛语系人群起源于以中国南方福建及其毗邻地区为代表的人群,而且它的时间至少可以追溯到8400年前。
从北向南、从南向更南
如果我们把这些研究成果放在更广阔的视角上,可以观察到这样一个现象,北方对南方有影响,南方古人群受到后期北方的压力后,继续向更南迁徙扩散到太平洋岛屿上,例如向瓦努阿图等更南的地方迁徙。
所以整体看上去,就是从北向南,从南向更南,这样的一个迁徙、演变的过程。当然我们还是可以在这张图上看到反向的趋势,但主体大方向还是刚刚说的这种情况。
最后一个知识点了
这些研究还给了我们一个很重要的信息,就是它修正了“东亚南方人群的层次”。
这是今天最后一个知识点了,还是有点难的,如果我没有讲好的话,希望各位能谅解,但是我尽量努力。
学术上针对东亚和东南亚人群的演化有一个“两层假说”。这个假说认为,距今5000年以前,中国东南沿海生活着一群古老的亚洲人,但他们与现代的东亚人没有明显联系,并不是我们的祖先。他们被称为“第一层”。
而以现代东亚人为代表的人群则是“第二层”。
在这个假说中,“第二层”人群随着农业的扩张取代了“第一层”狩猎采集人群。
我刚刚提到的南方奇和洞人和亮岛人,因为头骨特征被归入了“第一层”, 如果按照这个理论的话,他们应该在遗传上跟现代东亚人,也就是跟“第二层”没有联系。但古DNA证据告诉我们,这有可能是错误的。
他们与现今东亚人群、南岛语系人群都有着直接而且延续的遗传关系。所以这种“两层假说”在中国南方,尤其在福建这个区域,可能是要修正的。
还有一个有意思的现象。我们发现在东南亚的沿海地区,比如,越南4000多年前的人群跟福建同时期的古人群有遗传上的联系。而在日本,2700年前的绳纹文化个体,跟西伯利亚沿海地区、福建南方这些古人群也有遗传上的联系。
这反映出,海洋不但没有对人群造成隔离,反而很有可能是当时的一个非常重要的通道,促进了沿海区域人群之间的互动和基因交流。
我们的研究其实包含了非常多不同学科之间的合作和努力,比如考古学、遗传学,还有生物信息学、人类学等等不同学科的。所以非常感谢这里列出的考古单位,是他们让我们的这些研究成为可能,所以我在这里想感谢一下我们的合作者,让我们的研究能够更加夯实地去了解我们是谁,我们从哪里来。
今天的讲座只是一个开端,我希望我们未来对东亚人的演化能有更多的了解。谢谢大家。
本文来自微信公众号:一席(ID:yixiclub),主讲人:付巧妹(古遗传学家,中科院古脊椎所古DNA实验室主任)