扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-05-29 13:29

AI能写出基因组了,离它能合成生命还有多久?

本文来自微信公众号: 自然系列 ,作者:Nature Portfolio


2008年,研究人员报告了有史以来首个人工合成的活生物的基因组,该基因组是通过化学合成生殖支原体细菌(Mycoplasma genitalium)58万个核苷酸的基因组而产生的[1]。后续研究在细胞中“重启”了此类基因组,创造了科学家所称的第一个合成生命实例[2]。


如今,研究人员已利用人工智能设计出完整的基因组序列,其中包括一个受M.genitalium基因组启发的设计。该AI模型以生命之树上各类生物的数万亿个DNA字母为训练数据。


这些基因组设计——包括3月4日发表的一篇《自然》论文,介绍了用于生成这些设计的Evo2 DNA语言模型[3]——尽管令人印象深刻,但其他研究人员认为,这只是通向AI生成微生物生命的一步。


“这很酷,但还没到那一步。”荷兰瓦赫宁根大学的合成生物学家Nico Claassens说完。一个主要障碍是需要大规模合成并测试AI生成的基因组。另一个障碍是能指导哪怕极为简单生命形式全部基本功能的基因组仍难以设计,更不用说更复杂细胞的功能了。


然而,那些十多年来一直致力于从零开始设计基因组的科学家表示,这个曾经显得胆大包天的目标,如今似乎已经可以触及。英国曼彻斯特大学的基因组工程师Patrick Yizhi Cai表示:“这些AI模型是合成基因组学的‘ChatGPT时刻’。现在,我们可以开始编写自然界从未存在过的东西了。”


能工作的基因组


Cai说,以往进行的基因组编写工作大多只是修修补补,就好像对一本现成书籍的某一章节进行编辑,或删除所有逗号。Cai参与了一个即将完成的项目,目标是重写酿酒酵母(Saccharomyces cerevisiae)的基因组[4]。另一项工作则在大肠杆菌(Escherichia coli)基因组的近2万个位点上进行了重编码,弃用了64个用于指定蛋白质指令的“密码子”中的3个[5]。


Evo2这样的DNA语言模型,使人们有可能创造与现有生命差异更大的合成生命形式。2025年,加利福尼亚州Arc研究所的计算生物学家Brian Hie及同事使用Evo模型,编写了一类感染细菌的病毒(噬菌体)的基因组[6]。当研究人员把这些指令插入大肠杆菌细胞中时,285个设计中有16个生成了能杀死细菌的功能性病毒。


但这些噬菌体基因组只有数千个DNA字母长度,编码的基因也只有少数几个。即便与较小的细菌基因组相比,它们也要小得多、简单得多;而且多数科学家把病毒视为遗传寄生物,认为它们缺乏许多生命的标志性特征。


在新的Evo2论文中,由Hie和Arc研究所生物工程师Patrick Hsu领导的团队,利用该模型创建了受生殖支原体(M.genitalium)启发的基因组,以及人类线粒体基因组和一个酵母染色体的设计。


计算机预测显示,在这些受生殖支原体启发的序列中,近70%的基因看起来是合理的。但Claassens表示,如果哪怕只有一个必需基因缺失或某个基因建模不当,这个基因组就无法在细胞内正常工作。“你不能把生命设计到70%。你可以在计算机上这样做,但它不具备功能。”


英国剑桥大学机器学习科学家Maciej Wiatrak表示,即使包含了所有关键基因,这些基因的排列顺序也可能决定一个设计的成败。Wiatrak开发了另一种AI工具Bacformer,能够生成细菌基因组[7]。“评估你的基因组看起来对不对与它能不能正常运作是两码事。”


此外,在发布于bioRxiv预印本平台的一篇论文中,得克萨斯大学奥斯汀分校的研究人员发现,Evo2的基因组设计与天然基因组的组织方式不同,并且缺少一些关键特征[8]。研究人员表示,这并不意味着AI设计的基因组不具备功能,但它们对于理解基因组演化的启示可能有限——而这正是合成基因组研究的一个初衷。


值得投入吗?


Wiatrak也怀疑,从零开始设计一个微生物基因组是否值得投入如此多的精力和成本。他和同事们更感兴趣的是,利用Bacformer和Evo2这样的模型来设计一组能够协同工作的细菌基因,即所谓“操纵子(operons)”,它们可以执行有用的任务,例如生产生物燃料。


Hie相信他的团队设计基因组序列的能力将会提升。但要测试足够多的基因组设计(这需要合成相当于一个完整基因组长度的DNA,并按正确顺序进行组装),以找出那些能够工作的版本,在现有技术条件下将是一项挑战。他说,“实验正在迅速成为瓶颈。在这个尺度上,我们会撞上DNA合成和DNA构建成本的限制。”


Hsu表示,一种愿景是使用自主实验室,将AI与机器人技术结合,迭代式地设计、测试并优化小段基因组,之后再组合成一个完整可运行的基因组。Hie则表示,这种分步推进的方法,可能成为一条路径,用来编写比微生物基因组更庞大、更复杂的基因组,例如人类和其他哺乳动物的基因组。


Claassens表示,Evo2这样的AI工具能否终有一天设计出可运行的细胞基因组,这仍是个悬而未决的问题。他认为,要结合AI与其他方法,包括人类洞察力,才最有可能取得成功。


参考文献:


  1. Gibson,D.G.et al.Science319,1215–1220(2008).


  2. Gibson,D.G.et al.Science329,52–56(2010).


  3. Brixi,G.et al.Naturehttps://doi.org/10.1038/s41586-026-10176-5(2026).


  4. Goold,H.D.et al.Nature Commun.16,841(2025).


  5. Fredens,J.et al.Nature569,514–518(2019).


  6. King,S.H.et al.Preprint at bioRxiv https://doi.org/10.1101/2025.09.12.675911(2025).


  7. Wiatrak,M.et al.Preprint at bioRxiv https://doi.org/10.1101/2025.07.20.665723(2025).


  8. Tzanakakis,A.,Mouratidis,I.&Georgakopoulos-Soares,I.Preprint at bioRxiv https://doi.org/10.64898/2026.01.17.700093(2026).

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: