扫码打开虎嗅APP
本文来自微信公众号:学术头条(ID:SciTouTiao),作者:学术君,题图来自:The Tonight Show
蛋白质在生命中的重要作用不言而喻,它是生命的基石。而我们机体内合成蛋白质的过程也是相当复杂,不仅涉及到氨基酸活化等一系列过程,还受体内各种生化物质的调控。此外,蛋白质复杂的三维折叠结构,让想要人工合成蛋白质的科学家们望而却步。
当地时间 3 月 17 日,麻省理工学院科学家们带来了一个新成果,他们将蛋白质的复杂结构转化成乐谱,随后给予电脑一个种子序列,人工智能系统就能设计出一种自然界中从未见过的 “全新” 蛋白质。
他们发现这个 “全新” 蛋白质不仅具有折叠结构,而且比较稳定。此外,这种 “全新” 蛋白在自然界中从未发现。可以说,该研究为制造蛋白质提供了一种独特的方法。该研究成果发表在 APL Bioengineering中。
该研究作者,麻省理工学院的 Markus J. Buehler 表示,这样一种方法为制造全新的生物材料铺平了道路。比如人们在自然界中发现了一种蛋白酶,就可以通过这种方法改进催化效率或产生新的蛋白变异。
众所周知,氨基酸是构成蛋白质的基本单位,要想人工制造出蛋白质,要么模仿现有的蛋白质,要么手工编辑组成蛋白质的氨基酸序列,但是这两个过程都十分耗时,而且改变氨基酸序列后对整个蛋白质结构和功能会产生什么影响,也很难预测。
“蛋白质一定有它自己的语言。” Buehler 说。鉴于此,该团队尝试将蛋白质语言翻译成人们更容易理解的另一种形式——音乐,与音乐一样,蛋白质的结构也是分层的,在不同的长度或时间尺度上有不同的结构层次。
鉴于构成蛋白质的 20 种氨基酸,都有一个独特的振动频率(量子化学理论计算),因此整个蛋白质的化学结构能够通过音乐理论中的音符、音量、旋律和节奏来描述。
该团队已于去年 6 月份成功开发出一套可以将蛋白质分子结构转化为声音的系统,该研究当时发表在 ACS Nano 杂志。
该系统能够将自然界 20 种氨基酸转换成 20 个音调的音节,也就是说,构成任何一种蛋白质的氨基酸序列都能转换成一串音符。而蛋白质复杂的结构和功能信息也就编码在一段旋律的音调、音量和持续时间等维度中。
通过音乐来设计由氨基酸组成的蛋白质
然后,研究人员使用人工智能系统来研究多种不同蛋白质产生的旋律,他们让人工智能系统在音乐序列中引入微小的变化,随后将声音翻译回相对应的氨基酸序列。在生成蛋白的过程中,不同音乐的变化可通过控制温度参数来实现。
通过这个过程,研究人员能够创造现有蛋白质的变体,例如基于在自然界最强材料之一的蜘蛛丝中发现的一种蛋白质,来制造出不同于任何生物进化产生的更强大的蛋白质。
而在今天发表的这项研究中,研究人员使用蛋白质折叠方式产生的特定声音来训练人工智能系统,当系统学会理解折叠蛋白的复杂语言后,他们给予系统一个种子序列,随后人工智能系统根据这个初始序列推断并设计出一种 “全新” 蛋白。
那么这个 “全新” 的蛋白是否存在与自然界中,是我们认识的已知蛋白质呢?
该研究团队通过将这个 “全新” 蛋白与所有目前已知蛋白信息的大型数据库进行比较,并使用普通模式分析其分子动力学和特征,最终证实通过人工智能设计的 “全新” 蛋白在自然界中尚未发现,而且这种 “全新” 蛋白质具有稳定的折叠结构。
此外,研究人员发现,通过阐明蛋白质的节奏和音调,也有助于在古典音乐中创造新的作曲技巧,这个方法被 Buehler 称为 materiomusic。他表示,“在蛋白质数成千上万的进化过程中,自然界也给我们提供了声音如何组合的新思路”。
大家也可以一起听一下研究人员合成的一些蛋白质音乐:https://soundcloud.com/user-275864738
参考资料:
https://www.eurekalert.org/emb_releases/2020-03/aiop-cnp031220.php
https://aip.scitation.org/doi/10.1063/1.5133026
本文来自微信公众号:学术头条(ID:SciTouTiao),作者:学术君