扫码打开虎嗅APP
本文来自微信公众号: XYY的读书笔记 ,作者:肖俨衍,原文标题:《【读书】关键问题:生命起源于深海热泉?》
什么是生命?
地球史前简史&教科书的错误。地球的历史大概有45亿年,从锆石结晶体可以发现大约40-44亿年前地球上就有大面积的海洋了(比传统理念想的更早)。此外,传统研究认为早期地球上气体主要是甲烷、氢气、氨气,它们结合生产了有机物,但这些理论和锆石结晶体对不上——其显示早期地球上大气主要是火山喷发的氧化气体包括二氧化碳、水蒸气、氮气、二氧化硫等。这样的大气组成和现在大气组成差别不大,唯一差别是缺失了氧气,这需要光合作用普及之后才会改变。最早生命的迹象大概是38亿年前,主要来自石墨碳原子同位素差异的证据,而最早化石生命迹象则来自大约35亿年前。大约35-32亿年前,细菌演化出了呼吸和光合作用代谢机制。氧气产生过程(光合作用)产生于大约24-29亿年前。氧气出现给全球气候造成了巨变,其和甲烷发生化学反应造成了全球变冷。随着氧气出现,生命代谢所有需要的工具包齐全了,这整个时间是20亿年,是迄今为止所有动物历史的3倍。氧气出现通常被认为是一缕阳光,是好事,但这只是从动物角度,现在角度来说,对当时生物来说是一场灾难——氧气对它们有毒,且是化学反应活跃的。氧气出现倒逼细菌发生共生求生存,经过几亿年演化出了复杂的生物结构包括细胞核等,然后是真核生物,也就是当今动植物的祖先——这是教科书的故事,但作者认为这种说法是错误的。
为何所有复杂生物祖先都是真核生物?传统的进化观点主要注重基因和环境选择,因此环境从无氧到有氧,必然催生基因改变,从而决定生物演化,从而构成逻辑闭环。但是作者认为其中忽视另一个生物核心演化的约束——能量,万物演化都需要能量,而能量机制同样成为生物演化核心决定要素。作者认为如果氧气带来生命发展新周期,我们应该看到百花齐放的物种遗传继承树——不同物种将因为不同环境选择具备不同基因库,不同物种独立演化后,如果历史回溯将呈现百花齐放的局面,实际上这种现象也是常见的。反观,如果生物演化存在一些关键结构限制和瓶颈(比如能量),则生物演化可能经历很长时间停滞期(在突破这个瓶颈之前),生物的祖先可能只是少数几种(碰巧突破瓶颈的物种)。后者恰好是我们观察到情况,地球上所有复杂生物都来自一个真核生物祖先(动物、植物、真菌是复杂生物,而原始的细菌和古生菌不是复杂生物,它们属于原核生物),所有真核生物都有诸多类似的结构(比如复杂细胞膜结构等),形状(比如两种性别)。1960年生物学家Lynn Margulis发表一个惊世骇俗的结论:真核生物缘起不是标准的自然选择,而是一系列细菌和古生菌的共生。这个推论已经被科学证实,真核生物细胞中至少线粒体和叶绿体来自来自细菌共生。
罕见的事件。接下来需要问的一个问题是真核生物细胞这些复杂的结构来源是什么?前一步来自古生菌和细菌的共生。古生菌和细菌都是微生物,且没有细胞核以及真核生物一系列形状,但是古生菌和细菌却是截然不同的两种生物。虽然细菌和古生菌演化出了复杂的基因多样性,适应性等,但似乎过去几十亿年其背后有一种隐形的机制限制原核生物演化成为复杂的生物。而作者核心观点就是这种限制就是一种非常罕见的机制形成——高效能量机制,这件事罕见到什么程度?过去几十亿年可能仅成功了一次。综上,生物演化背后四大要素应该是基因、环境、竞争、罕见事件(比如共生、比如陨石)。
生命的能量来源——ATP
维持生命的必要条件——能量ATP。根据热力学第二定律,孤立系统的熵是单向增加的。然而,生命体内部秩序统一情况下,熵不会发生显著变化。其根本原因是生命体会和外部环境发生互动,通过向外界释放能量,可以保持内部熵稳定甚至下降。简单来讲,生物保持秩序,但是外部环境因熵增而混乱。可以用以下公式来表示能量、热量,熵等关系(如下图):其中左边F是外部获取能量(生物必须从外界获取能量),这种free energy必须是负的(才是从外界获取)。中间U则代表内部的热能,而右边则分别是内部的熵,以及温度。从公式来看,保持U为负,内部的熵可以不增长(甚至减少),只要U负得更厉害,也就是持续向外界释放热能。所有生命细胞使用的内部能量货币都是ATP,可以将其类比为游乐园机器的游戏币,对于人类ATP每天的turnover可以达到40-60kg,基本接近成年人体重,每分钟每个ATP会被“充电”1-2次。ATP合成机制如下图2,这套机制在所有生物中都通用,为了支持20分钟/次的分裂,细菌E coli每个细胞结构要消耗50亿单位的ATP,而65kg的人类相当于功率是130瓦特。对于地球,每时每刻生物耗能很大,但是太阳单位时间传递到地球的能量比这多得多。对于地球上生物有两个惊人相似,其一是所有生物获取能量的背后化学原理都相同——氧化还原反应,主要是电子的迁移。诺贝尔奖得主、生物化学家阿尔伯特·圣捷尔吉说:“生命无非是一个电子在寻找安息之所”。不管植物光合作用,还是动物呼吸,内在原理都一样。其二则是能量的载体都是ATP,且其产生机制都是在不同细胞膜之间的质子梯度流动。这套机制相当复杂,且反直觉,为何所有生命都默契采用相同的反直觉的能量获取机制?

呼吸链式过程详解。简单来讲,呼吸整个过程都发生在线粒体细胞中,核心点一个是电子驱动,一个是质子梯度的形成,线粒体细胞中有三个复杂蛋白质结构完成核心操作——一面接受电子,一面释放质子。最终释放出来的质子则最终参与到的ATP合成机制中。质子累计会产生电压,这种电压看似微小,但是考虑到膜很薄,其单位电压可以达到3000万伏/米,和闪电电压差不多。每一个线粒体中包含数千个类似呼吸链架构,而每个动物细胞里有成百上千个线粒体,人体40万亿细胞中有几千万亿个线粒体。ATP合成机制在所有细菌、古生菌、真核生物中都通用,作者认为其通用型性,对于所有生物重要意义不亚于基因。

为何地球上生命都依赖于氧化还原反应?生命核心构成是碳元素,最基础表达是类似CH2O的有机物,考虑到地球最早有丰富的二氧化碳,要形成有机物必须有电子和质子和CO2的交换,从而形成有机物,这些质子和电子可能来源于水,也可以来源于二氧化硫,它们和CO2发生反应都生成了有机物。在呼吸链中,氧气在这套反应中并不是必须,氧化物也可以接受电子和质子,从而结合形成ATP。比如植物的光合作用,其电子和质子来源就可以是水,而最终产物则是氧气。但背后其合成的仍然是ATP,其使用的呼吸蛋白和机制也完全相同。氧化还原反应的原料在化学反应性上不能太活跃,不然其短期发生化学反应后能量以下就释放完毕了,没有后续能量了。整体来看,这套氧化还原,电子和质子迁移机制非常普适,可以适应各种环境,作者甚至认为这种普适性意味着其他星球如果有生命,大概率也是这种能量机制。
生命的起源——碱性深海热泉
从能量角度否定原始汤假说。如今生物的呼吸链中充满各种催化剂酶,这些酶在早期生物中大概率是缺少的,因此早期生物要演化大概率需要更多能量。关于生命起源,传统的假说包括原始汤假说(生命诞生于原始海洋中微生物演化,主要能量来源于闪电),1953年Stanley Miller成功在原始汤模型中合成一些氨基酸,其是蛋白质基础单位,从而被认为验证了原始汤假说,这个实验在当时轰动效应甚至超过了沃森发现DNA双螺旋架构,Miller本人甚至还登上了1953年时代杂志封面人物。但作者从能量的角度否定了原始汤假说,因为要实现类似的演化,需要在每平方公里的海洋面积上,每秒钟有四道闪电,这显然不符合现实。
如何制造细胞?作者认为至少需要六个必要,且独立存在的条件:
1)持续且活跃的碳元素来源。考虑到核苷酸(RNA/DNA主要单元)主要由氰胺组成,这就是原始信号。此外,考虑到碳原始材料持续性,可以排除冰冻环境。
2)持续不断的free energy来推动代谢化学反应,从而产生蛋白质,DNA等生命架构。这种能量来源大概率是类似ATP的物质。
3)加速这些反应的催化剂;如今的催化剂酶也是有机物,RNA也有部分催化剂效果,而早期的酶很可能是无机物,比如铁等。
4)向外界排泄能量,从而保持内部熵稳定。此外,如果不能及时清空废料,新的“乘客”就会被堵住。此外,这种清空——新加入的关系也阻碍了细胞尺寸不能过大。
5)细胞膜结构将细胞内部和外部分开。生物细胞膜组成成分也是油脂,其本身也是有机物。
6)遗传信息。DNA组成单元核苷酸本身也是有机物。
深海热泉可以提供生命起源必要条件。早期的地球主要是大海,因此热泉大部分都分布在海底。如今在这些深海热泉中可以发现不少未知生物(例如细菌),但这些生物氧化还原反应很多都涉及氧气,而早期地球没有氧气。真正的起源可能是碱性深海热泉,其和火山无关和岩浆无关,其温度大概60-90度,区别于火山热泉的400度。2000年,第一座碱性深海热泉Lost City被发现,其已经存在了10万年,另一个重要特性就是碱性(之后我们会知道为何重要)。碱性深海热泉有很多微孔,其中可以集中大量的有机分子(微孔起到类似细胞膜隔绝作用),这种高密度则进一步催化了化学反应。早期的碱性深海热泉和如今最大不同可能就是氧气稀薄,但二氧化碳浓度高很多,是当今的100-1000倍。深海热泉有大量矿物质,在缺氧的环境下,铁的形态主要是氢氧化物和硫化物,其至今仍然是生物中重要的酶。当今的大海PH值大约是8,而早年的大海是酸性的,PH大概是5-7。
碱性深海热泉酸碱差催化质子梯度反应。以上这些环境支持CO2+H2生成CH4甲烷(有机物)的化学反应,Lost City至今中也产生少量甲烷,这个反应将释放热量,且这个反应本身就是前文中提到的氧化还原反应,其中氢气提供质子和电子,而二氧化碳则是接收方。然而,问题是二氧化碳和氢气发生反应需要能量输入,且反应难度很高。然而,碱性深海热泉提供了相当独特的环境,其内部呈现碱性,而外部海洋是酸性,这种酸碱差给二氧化碳和氢气反应创造了得天独厚的条件(如下图)。如果氢气在PH=10的碱性环境,而CO2在PH=5的酸性环境,它们就会合成CH2O有机物,而质子和电子也会相应释放,从而产生类似质子梯度。依靠质子梯度可以产生有机物(有机代谢),同样依靠质子梯度,也可以合成类似ATP(能量代谢)。这个反应在纯酸和纯碱环境下都不会发生,因此只有碱性深海热泉能够提供独特反应条件。以上并不能断定深海热泉就是生命来源,但是从能量来源来看,目前来说只有它是完美符合条件。

生命如何从深海热泉中走出?
从细菌和古生菌基因相同和差异溯源生物共同祖先LUCA。常规的物种区分主要是通过生殖隔离,不同动植物可以基于基因传递和物种隔离绘制出其树状遗传图。然而这种追溯祖先方式在细菌不适用,因为细菌的基因可以通过横向迁移而得来(直接从环境中获取,),因此其基因变化速度很快(很快产生抗药性),基因变化对应性状变化,因此其也很难从遗传角度区分性状。以E coli基因为例,其个体之间基因变化方差可达30%,这比人类和黑猩猩的基因差距大10倍。这种变化速度,几乎很难确认细菌过去30亿年演化的路径。曾有科学家追踪细菌和古生菌48个基因溯源,只确定了LUCA是细菌和古生菌的统一祖先(实际上能够溯源到LUCA的共同基因只有100个),而无法确认不同细菌和古生菌之间的从属关系。即使知道了某种细菌是最古老品种,你也无法确认它之前性状和现在一样。考虑到细菌和古生菌都采用质子梯度原理合成能量ATP,那100个共同基因里面大概率有生成呼吸系统的基因,由此呼吸机制很可能是LUCA时候就具备了。然而,细菌和古生菌在很多基础维度存在根本差异,例如两者呼吸中用的酶基本都不同,细胞内部薄膜材质也不同,细胞壁材质也不同。如何解释这种差异性?一种解释是LUCA可能天生有两种呼吸机制,而细菌和古生菌分别只继承了一种。但这种解释前提是LUCA有比后代大得多的基因库,这从进化方向来说不太可能(祖先比后代还先进)。另一种解释是环境选择,比如古生菌由于需要适应高温环境而演化出不同结构。但很多细菌也耐高温,很多细菌和古生菌生存的环境差不多,自然也就排除了这种可能。剩下就只有一种可能性了,LUCA有基础的呼吸机制,有DNA和表达机制,但是没有复杂的架构比如薄膜,比如呼吸链中复杂的蛋白质,而细菌和古生菌则独立演化出两套不同的呼吸链系统。
LUCA起源的三步。LUCA的基础氧化还原反应呼吸机制叫做“乙酰辅酶A途径”(以下简称A途径),其原料就是前文提到的氢气和二氧化碳,其反应产生有机物,并且释放能量,而这部分能量则可以进一步催化现有有机物反应生成DNA、蛋白质等有机分子,这套反应的催化剂是无机物比如铁,因此有机物的核心来源是无机物,有生于无。如今的产甲烷菌(古生菌)仍然沿用了这种古老的代谢机制。A途径产物除了有机物,另一个重要产物是乙酰磷酸,其可以实现类似ATP的作用,可以说是原始版ATP。因此A途径本质是一石二鸟,同时解决了碳代谢和能量代谢的两大核心问题。早期原始合成细胞过程可能分三步:1.在碱性深海热泉的环境中,隔着充满无机物铁、硫的薄膜发生的质子梯度反应催生了小的有机物分子,并且不断累计密度。2.随着有机分子之间互动,可以产生早期微型细胞结构,包括形成油脂材质的细胞薄膜等,这些结构出现在细胞内部,但是反应的动力主要来自外部质子梯度。3.DNA出现,引入了自然选择竞争优胜劣汰机制,由此产生了例如染色体,ATP合成呼吸机制等复杂机制,并且催生了LUCA,其大概率就生活在碱性深海热泉当中,而以上三步大概率也在深海热泉中完成。
从被动呼吸到主动呼吸。对于LUCA分析逻辑自洽,然而其对比当今却有一个巨大的gap,LUCA细胞膜是通透的,因此才能受益于天然质子梯度,然而如今的生物(比如人类)细胞内线粒体的薄膜是不通透的,这看似有不可调和的矛盾。复杂生物的氧化还原反应不需要借助外界特定环境(比如碱性深海热泉的酸碱差),可以自主形成质子梯度,而这也是氰化物毒害所在,其可以迅速终止氧化反应反应,从而让人速死。如果假设生物线粒体薄膜是完全通透的,那线粒体中的酸碱度可能很快达到均衡,从而终止氧化还原反应,生命也就终止了。由此,要实现自主呼吸链,线粒体薄膜必须对质子不通透,质子来了就走不了了,这样氧化反应反应才能持续。但这里还有问题,早期LUCA需要借助外界环境,所以薄膜必须是通透的,而任何不通透薄膜的变异很可能都会被淘汰,除非其演化出自主呼吸机制,可是如果LUCA在原有环境中活的很好,其为何要演化自主呼吸机制呢?有一种可能解释可以两者兼得——产甲烷菌有一个一个独特蛋白质结构antiporter和非常独特的薄膜,其对于质子通透性强,但是对于钠离子却通透性很不强,由此其演化出两套质子梯度机制。一方面其仍然受益于外部环境的氢原子质子梯度,此外其还演化出一套钠离子的自主质子梯度呼吸机制,后者可以给其提供60%多余的能量。这套机制带来两个好处:1.更多能量意味着更强的自然选择竞争力;2.更少自然环境依赖,说明这种生物可以适应酸碱度差更小的环境,从而可以拓展更新的生活环境,但他们仍然不能离开深海热泉,仍然需要一步演化才可以。有了自主呼吸机制的生物便改变了薄膜的特性——不通透的薄膜将越来利于进化,从而打开更复杂细胞结构的大门。最终细胞可以完全独立于外界环境完成自主呼吸,从而走出了深海热泉,占领那个空白的地球了。
为何细菌和古生菌如此不同。古生菌和细菌在DNA翻译,染色体,蛋白质合成等维度类似。但也有诸多根本性差异,比如薄膜材料差异等。简单来说,正是从LUCA被动呼吸走向主动呼吸的过程中,形成自主质子梯度的过程中,细菌和古生菌演化出来两套独立不同的自主呼吸机制,从而造成了两者各方面显著差异。细菌的方案包括,薄膜材料使用酯键脂质,可以想象成用“油脂”造膜,分子是直链的,结构相对简单。其核心“泵”利用电子传递链(一种蛋白质复合物链)在膜上传递电子。在这个过程中,就像接力赛一样,某些关键的“选手”(如醌类物质、特定的质子泵酶)会顺势把膜内的质子“扔”到膜外。这套系统的核心部件(如某些关键的酶)是细菌特有的。古生菌的方案薄膜材料使用醚键脂质这种脂质分子像“脚手架”一样更坚固,甚至能形成单层膜(细菌和真核生物都是双层膜),极其耐高温和酸碱。核心“泵”,它们也用电了传递链,但许多核心蛋白质与细菌的完全不问源,是独立演化出来的。例如,它们使用一种独特的、与细菌完全不同的类酶复合物来启动质子泵送过程。它们的电子传递载体也常常不同。
复杂生物的诞生
原核生物为何演化不出复杂结构?细菌和古生菌展现出惊人多样性——一个单独品类细菌多样性可以超过整个真核生物(细菌基因可以横向迁移),这种惊人多样性意味着强大的环境适应能力。然而,由于某种原因,细菌和古生菌在过去40亿年历史中基础结构没有很大变化,始终没有演化出类似真核生物一样的复杂的架构。某种程度来说,细菌属于化学家,各种复杂的化学反应是其适应环境核心武器。但真核生物则走物理学路线,通过演化出复杂各种器官来适应外界环境。阻碍细菌等原核生物演化出复杂结构的原因可能有什么?一种说法是细胞壁,有些演化丢失了细胞壁的细菌就可以被吞噬,有科学家说吞噬是共生的基础。但是也有很多细菌丢失了细胞壁但是却没有演化出复杂结构。一种说法是染色体,原核生物基因表达是串联的,而其繁殖主要靠细胞分裂,后者速度往往大于基因复制速度,由此染色体越长其越成为细胞复制阻碍,由此原核生物的基因大小受到限制。而染色体短的细菌复制速度越快,其很可能在具有更强的竞争力。因此细菌的演化方向之一甚至是去掉多余的基因(少就是多,基因越来越少),如果不小心去掉了关键基因也没关系,利用横向迁移机制从环境中获取就可以。但这个原因也不绝对,部分细菌和古生菌甚至演化出了直的染色体,和并行表达模式,但他们仍然无法演化出复杂的生理结构。大部分尝试解释这个问题都被例外而证伪。
从基因溯源看真核生物和原核生物关系。从基因溯源的方法来看,真核生物大概有三分之一的基因可以溯源到原核生物,其中四分之三来自于细菌,四分之一来自古生菌。为何真核生物会有三分之二的独特基因?一种可能解释是因为真核生物生活环境完全不同于原核生物,因此需要演化独特不同基因。而从与原核生物重合基因部分来看,来自细菌部分也不是来自同一细菌(比如线粒体的祖先α-变形菌纲),而是至少25种细菌。这种现象原因是因为现在的细菌和当时细菌基因已经改变(前文也提到过类似),主要原因是横向迁移。此外,早年的共生的源头只有一个(原核生物和真核生物没有中间体),且之后原核生物基因就一直传承了。以上两点和我们基因溯源的答案逻辑自洽。
阻碍原核生物演化出复杂结构的核心当然还是能量。具体来说是能量/基因这个密度单位。经过计算,真核生物能量/基因的密度是原核生物的20万倍,这倒鸿沟解释了为何真核生物可以演化,而原核生物不能。细菌的呼吸速度是真核细胞的三倍(呼吸更快),但是真核细胞的体积是细菌是15000倍,因此真核细胞每秒消耗的氧气是细菌的5000倍(15000/3)。这些能量都花在哪里?大概只有2%花在DNA复制,有80%都花在了蛋白质合成。或者说更多能量意味着更多蛋白质合成,而一个蛋白质往往对应基因表达,也就意味着更多DNA基因。细菌平均有1.3万染色体,而人的肾脏细胞有1300万。细菌大约有5000个基因,而真核生物一般至少有2万。整体来看,真核生物可以拥有5000倍原核生物基因数量,或者其可以运用到每个基因表达上ATP能量是原核生物5000倍,自然也就可以打造复杂得多的蛋白质结构。相反的是,细菌如果体积变大对于自然演化很不利,假设将细菌体积增加1.5万倍到真核生物,其半径增加25倍,表面积仅增加625倍,其ATP合成的能力仅增加了625倍(和表面积相关),但是其耗能增加了1.5万倍(和体积有关),这显然不划算。自然界中存在体积和原核生物差不多的细菌,但是他们结构往往是基因贴近细胞膜,细菌中间几乎真空(为了节省能量),没有蛋白质等。这些细菌大部分空间只是用来增加表面积以从贫瘠环境中吸收营养,并非为了复杂化。
共生带来的尺寸-生产-消费正循环。为何阻碍细菌演化的原因不会阻碍真核生物,答案就在线粒体。细菌的DNA主要靠复制,因此其下一代和上一代几乎没有变化,因此也谈不上自然选择,唯一核心竞争要素是复制速度,考虑到细菌迭代速度很快,细微的复制速度差距最终会演化为巨大的差异。而要快速复制,越少DNA越好,因此细菌的DNA倾向于减少。此后,环境改变,原有的基因可能无法适应新环境,只有通过横向迁移获取有用基因的细菌再次竞争中取胜,成为统治物种。因此细菌要持续获得统治性,共生是好方式,因为细胞内的环境显然要比外界稳定得多,且这种共生是不需要吞噬方式达成的共生(很罕见,但是存在)。在共生背景下,细菌可以持续减少基因,一方面加快复制速度,另一方面还可以降低能耗,节省下的能量可以干别的(比如演化复杂蛋白质),一举两得。线粒体的祖先细菌大概有4000个基因,在漫长演化过程中其损失了99%的基因,其每天可以节约1万亿ATP,而其生产ATP能力则不减少,妥妥的低耗能高产出。线粒体损失的DNA并没有浪费,它们进入细胞核成为真核生物的DNA原材料,假设100个共生的细菌每个贡献200个基因,总共就有2万个DNA可供使用,这就是人类基因大小了。为何线粒体不损失100%的基因?答案是留下来的都是必须在终端处理的关键基因,前文提到呼吸链中线粒体薄膜会产生很高的单位电压(相当于闪电),而部分关键蛋白质必须要本地基因负责生成才能扛住这么高的电压。由此,共生打开一个细胞尺寸变大正循环,一方面更多线粒体带来更多能量ATP产出,而共生好处使得线粒体损失DNA从而降低能耗。此外,如果只增加ATP供给,而不增加耗能,ADP很快就会用完,从而导致能量机制终止。因此,生产更多能量必然也会导致消费更多能量(合成更复杂蛋白质),这就简历了生产和消费的正循环,正是这种循环不断运转,真核生物才能不断演化。这是一起罕见的成功的共生,因为过去40亿年仅仅成功了一次。
如何解释真核生物DNA中的introns(不表达的基因)。共生本身是偶然罕见事件,但是真核生物一系列形状(比如细胞核,比如两性)等则是完全类似达尔文自然选择过程带来的进化。而从真核生物都拥有这些形状来看,真核生物祖先应该在相对短时间内演化这些共同的形状(不然可能会出现很多物种分叉)。作者认为几百万年就够了,相对于细菌30亿年基础结构都没怎么变化,这简直可算得上“一瞬间”。真核生物祖先应该数量也不大(地域也相对集中),否则其会很快占领不同地区,从而带来其他中间体演变。由于细胞分裂(无性繁殖)反而会导致基因方差增加(突变会累计然后直接复制,还有横向迁移),性繁殖(目前已知所有真核生物都是性繁殖)反而可以更好降低基因方差(优胜劣汰,错误突变都被淘汰了),因此真核生物的性繁殖可能很早就有了,由此真核生物基因方差变异远小于细菌和古生菌。真核生物基因(会表达成蛋白质的)都是成片状的,中间穿插的无用的introns。这种片状基因好处首先是可以排列组合形成更多更复杂的蛋白质结构。也有科学家认为片状的,短片的基因面对基因突变时更加稳定,从而有利于生存(大部分基因突变都是负向的)。这些introns来源是什么?答案就是共生,比如线粒体损失那99%的基因,还比如在共生实现中死亡(实验失败)的细菌的DNA,有些就变成了“寄生基因”。为了应对这些基因噪音,真核细胞演化出了剪接体,主要负责在染色体中寻找有效基因。这些introns应该出现时间点很早,而真核生物后代也遗传了这些introns。一个证据是真核生物后代有部分DNA虽然遗传自祖先,但此后会复制N次从而形成一个基因家族。如果introns是后期出现的,则这些基因家族可能会出现随机introns插入现象,而如果introns出现很早,则这些introns大概率也会一起被复制。实验结果证明是后者。
细胞核的来源。实际上,正如地球氧气大规模产生对当时大部分生物是坏事。早年的细菌进入古生菌共生很可能早期也不是好事。主要症结就在基因入侵,这些细菌基因随意入侵寄主古生菌的基因,而后者几乎没有防御机制(早期没有演化),这背后一定带来的是动荡,如果共生细菌活着问题还不大,但如果共生失败细菌死了,其基因就成为100%入侵物。估计大部分试验都失败了,真核生物祖先数量少也就不足为奇了。更头疼的是剪接体(剪接无效基因的)剪接速度还很慢,即使是20亿年后今天,剪接体剪接基因都要几分钟。然而,染色体表达蛋白质却很快,半分钟就可以表达一个标准蛋白质。这一快一慢的差异会导致剪接体还没完成工作,一堆无效的蛋白质可能已经生成了。这时候细胞核的作用就显现了,其主要作用就是挡住染色体,让他们在剪接体完成工作之前别瞎表达。这样解释了为何只有真核生物有细胞核,而原核生物没有(不需要)。
有性繁殖有哪些优势?真核生物的性繁殖是相互的、完整基因库的重组,这在原核生物不常见。这种重组方式一方面可以保证基因库的稳定性(比如相对于细菌稳定的多),另一方面则可以提供足够多样性供自然选择优胜劣汰。既有稳定,也有必要的变化。假设一个100基因的细胞分裂的DNA,其中几个关键基因决定生死,只要它们不突变,生物就不会死。但是,其他相对次要基因突变恶化却可能会不断累积,整个生物DNA可能会逐渐恶化,这有点像人类的Y染色体。简答来讲,无性繁殖的基因特别容易固化,一个好基因可能代表其统治整个品类,而其剩下基因也会一起统治,这种基因方差大(横向迁移带来方差),但是多样性很低,面对外界环境变化很容易灭绝。如前文,有性繁殖有很多好处,但也有缺点,比如无性繁殖每一次分裂都是2的N次方指数级数量增长,但是有性繁殖是两个生一个(基础单位)。此外,有性繁殖引入了寻找配偶的新难题,这带来许多额外的成本(比如艾滋病等)。在何种状况下,有性繁殖明显优于无性繁殖,答案是高突变率和基因尺寸更大时候,对于前者有性繁殖提供多样性供自然环境优胜劣汰,其对环境适应性显著提升。而真核生物诞生时候面对基因入侵,显然是高突变率情况。其次是基因尺寸,真核生物DNA显著更多,自然也有更高突变率。反观细菌基因一般越来越少,自然突变率低些。
为何只有两种性别——只有雌性传递线粒体。而不是更少、或更多呢?假设只有一种性别,任何个体都可以互相繁殖,性繁殖门槛会降低。假设有3种以上性别,那特定性别可以选择四分之三或者三分之二的人繁殖,而不是现在的仅有50%。最主要原因可能是只有两性才能比较解决雌性成本更高问题(如果三种性别,哪种为雌性?)。早在单细胞真核生物时候,两性就出现了。而最大的两性区别之一则是线粒体的生殖传递方式——只有雌性通过卵细胞给后代传递线粒体,而雄性只传递基因,不传递线粒体。人类也是,我们线粒体仅来自母亲,大概在卵细胞里有10万个。早期的藻类虽然两性配子相同,也只有雌性传递线粒体。这种传递方式原因之一可能是防止内在冲突,如果双方都传递线粒体,则更有可能导致不同基因线粒体(有部分自己的基因)互相竞争产生冲突。要让呼吸链反应顺畅,需要线粒体基因和细胞核的基因紧密配合(复杂蛋白质结构是双方基因共同表达结果),而单性的线粒体传递,能够更好完成两者之间适配。此外,这种单性传递线粒体方式也能带来一些多样性,从而供自然选择(从母体选择部分线粒体然后复制繁殖,中间也会经历突变等)。又是一个平衡兼容性和多样性的结果。
决定寿命的关键问题。线粒体基因突变的速度是细胞核的10-50倍(后文会提到这是很多疾病、生老病死的来源),但是如前文所说两者必须紧密配合才能使得呼吸机制顺畅,这又是一个头疼的节奏不同步问题。一种解决方案是前文所说的单性传递,另一种方案则是卵细胞必须体积更大,因为只有包含更多的线粒体才能尽可能平衡掉突变的正负方差(大样本)。最后则是隔离的生殖细胞(例如卵子)似乎被“冷冻”了,进一步降低了突变率。不过,早期的动物例如珊瑚有精子和卵子,但是没有隔离生殖细胞。所以隔离生殖细胞是随着线粒体突变率提升而演化出来机制?为何线粒体突变率会提升呢?一种原因可能是氧气时代到来后,地球出现了对称动物,其极大提升了线粒体突变率。早年的动物比如海绵其大部分细胞都可以通用可复制的(类似蚯蚓,部分可以复制全部)。由于隔离生殖细胞演化(更安全了),也演化出了定位细分其不可复制的细胞和器官(比如大脑),这也带来了个体的寿命的问题(取决于内部复制能力)。相反,类似海绵、珊瑚这种生殖细胞保持通用性的生物,其寿命可以达到数千年甚至上万年(羡慕吧),它们寿命取决因素在于外部环境,而不在内部。
基于能量机制的关键预测
细胞核和线粒体基因必须匹配,杂交优势VS杂交毁灭。如前文所言,呼吸链的核心组成部分是几个复杂结构的蛋白,而表达这些蛋白的基因则部分在线粒体,部分在细胞核,而线粒体基因突变速度是细胞核的10-50倍(线粒体在适应环境的先锋,能量机制可能是适应环境重要变量,因此其基因突变速度更快有利于快速适应环境),任何细微基因突变(往往是线粒体)都可能导致呼吸链不顺畅,从而生命获取能量效率变低,甚至死亡。为何大部分呼吸链的蛋白表达基因要留在细胞核,而不是线粒体?答案可能是为了男性健康,因为线粒体只是母系遗传,其很难留下利于男性健康的基因。细胞核的基因传递则可以兼容男性和女性。实际上,如果我们回溯过往细胞核和线粒体基因演变路径,我们发现两者基因演变速度几乎相同。这并不是前面判断错了,而是大部分不同步的基因突变都被自然选择淘汰了。假设线粒体基因和细胞核基因不匹配,很可能就会启动细胞凋亡机制:当细胞进入凋亡状态时,其会经历一系列严格的流程然后死亡,其是多细胞生物新陈代谢重要方式。而从线粒体逃出的细胞色素c则是这种凋亡机制的触发因素,且这种机制和呼吸链一样在物种中通用。在繁殖过程中,一旦发现线粒体和细胞核基因不匹配,最好方法就是在尽早时候终止繁殖。这就引进了自然界重要的平衡健康度和生育率,更高的健康度门槛要求(比如鸟类)往往是对线粒体和细胞核基因匹配更高的要求,由此会导致更低的生育率(基因突变速度不变,但是自然选择速度加快,淘汰率增加)。很多物种亲缘关系比较远的物种虽然没有完全生殖隔离,但是其后代线粒体和细胞核基因不匹配概率较高,因此会非常虚弱。这个听起来和传统说的杂种优势相违背,反而是杂种危害,这也就是过度的基因关系疏远也会带来损害的典型案例。
能量需求越高越容易寿命低,不育。在两性繁殖生物中,稀缺的,容易不育的一定是异配性别,比如人类男性(Y染色体)和鸟类的雌性。事实表明,即使没有两条不一样染色体性别决定机制的动物(爬行动物,很多靠繁育时候温度决定性别),依然呈现出异配性别的特点。潜在解释之一就是呼吸代谢能量机制。在哺乳动物中,雄性的生殖细胞生长速度会比雌性快一点,这意味着雄性更高的能量代谢速度。这也能解释温度可能影响性别,因此提高问题会加速能量代谢速度。作者甚至认为性别的根本决定要素就是能量代谢速度。能量代谢需求越高越容易面临供给不足的风险,比如如果一个人停止呼吸,人体中大脑和心脏会先死。而皮肤细胞可能就能生存更久时间。线粒体疾病也最有可能影响这些耗能最高的器官(比如眼睛)。细胞凋亡可以淘汰一些不够的细胞,但是有一些细胞是不可替代的,比如一个特定神经细胞死亡后,其承载信息链都断联了。正因为细胞高度分工产生不可复制的细胞,动物的寿命才成为有限的。由此由于男性基础能量代谢要求高,其更可能被线粒体基因突变等疾病影响,从而影响寿命。例如,莱伯遗传性视神经病变在男性中的发病率是女性的五倍。影响生育机制也类似,雄性能量代谢需求高会导致关键器官容易退变(比如影响鸟类睾丸),从而导致不育。这些因素使得雌性鸟类择偶时候要谨慎,它们选择羽毛靓丽的雄性,很可能羽毛颜色靓丽和线粒体健康程度有关。
能量代谢要求、生育率、健康、寿命。如前文所述,线粒体和细胞核基因如果出现不匹配,最好方法就是尽早终止繁殖,但这里有一个阈值,突破这个阈值会导致繁育终止。而这个阈值设定高低其实是两种不同的策略,其根据不同物种需求有差异。比如鸟类,由于其需要飞翔显然肌肉有很高的能量要求,然而这种能量需求并不能简单增加线粒体数量而解决(线粒体也需要配套),由此其显然需要超级线粒体。由此,鸟类这个阈值应该设定越低越好(同样还有蝙蝠),少量线粒体和细胞核基因不匹配就应该终止生殖细胞繁殖,这就会降低生育率。人类大概40%的早期胚胎因为此终止发育(可能在一周之内,我们都不知道)。反之,如果我们提高这个阈值,我们将提高生育率(大部分生殖细胞可以持续繁殖),但是这些后代很可能会有部分线粒体疾病,可能不能胜任飞行这种高标准的动作。这里还有个平衡,鸟类由于对线粒体和细胞核基因配合要求高,显然就降低基因多样性,从而降低其对环境适应性,这能解释为何鸟类总是迁移应对季节变化。但是,由于不健康的胚胎在早期就被终止了,成功生长的鸟类一般线粒体疾病概率较低,整体更健康(不健康的早早就被淘汰了)。综上,我们看到生育率、适应性、代谢健康度、疾病等在线粒体和细胞核基因匹配角度都是互相制衡的要素。其和寿命也有关系,鸟类寿命(阈值低)一般能有几十年,而小鼠(阈值高)则只有3年左右。
人的寿命很难系统性超过120岁?自由基理论认为线粒体释放的自由基对DNA和蛋白质都有害,自然也有损于健康。如果自由基理论是对的,那抗氧化剂(比如维生素C)就有利于长寿,因为其可以终止自由基导致的一系列有害反应。然而,一系列研究表明自由基理论并没有坚实的基础,抗氧化剂对寿命帮助不大。相反,过度的抗氧化剂反而可能有损健康,很多长寿动物身体内抗氧化酶含量很低,而寿命短的动物反而很高。且氧化剂可能反而有利于健康。一定水平的自由基有利于线粒体释放更多呼吸能量,从而有利于ATP生成。由此降低自由基数量,反而降低ATP生成能力。但是,过度的自由基会引发细胞凋亡机制。其背后的道理是,如果问题可解决,自由基会提高ATP生成效率,解决问题。如果问题解决不了,则就引发凋亡机制放弃。由此,过度维生素C摄入反而可能会影响身体健康。有一种理论说寿命和代谢速度成反比,因此越懒的人越健康。其实这种理论也是错的,这种理论在同物种之间通常成立,但跨物种不行。比如前文提到鸟类寿命显著长于小鼠。但实验证明,身体运行速率(比如运动时候)和自由基释放速度没什么关系。作者认为运动、低碳水饮食等都是对健康有益的,因为他能够加速代谢掉那些线粒体和细胞核不兼容的突变细胞,但很可能会降低生育率(如前文两者是跷跷板)。亨利福特据说经常通过观察破旧福特哪些部件仍然良好,说明这些部件过度设计了。人体也类似,人体寿命取决于最短的器官,比如大脑,因此在演化过程中其他器官没有必要形成显著比大脑更长的寿命。因此作者认为基于现有的身体系统,人类寿命很难超过120岁(需要系统性全面改变,难度很高)。要延长寿命方法可能就是降低呼吸链基因匹配的阈值(类似鸟类),这显然又降低了生育率。
结语:解决问题的关键是找到关键问题
读完这本书有两点印象深刻:其一是线粒体细菌和古生菌,氧气诞生,这两件深深改变地球生物学界重要事件,在我们当今看来都是大大的好事,在当时的生物看来却是天大的灾难:线粒体对古生菌的共生本质上是一种入侵,其带来大量基因入侵,估计大部分共生的尝试都失败了。氧气普及也是,大部分当时生物都是厌氧的,氧气密度提升对他们也是一场灾难,造成了地球上当时大部分生物灭绝。真是福兮祸所依。
这本书中作者从一个单独的质子梯度呼吸能量机制切入,竟然建立生命起源于深海热泉假说,并且解释了复杂生物诞生过程,解释了细胞核、性繁殖等重要特点来源,解释了生育率和健康的跷跷板关系,解释了寿命问题。找到一个关键问题,确实是解决问题的关键。