扫码打开虎嗅APP
本文来自微信公众号:硅星GenAI (ID:gh_e06235300f0d),作者:张潇雪,原文标题:《AI接近成为神?谷歌AlphaFold 3直接预测生命过程》,题图来自:视觉中国
当人们还在呼唤GPT-5、辗转于各种聊天机器人争夺战时,Google已经把人工智能模型与现实世界的距离又拉近了一大步。
Google DeepMind负责人Demis Hassabis隆重官宣了这项革命性成果:
Google Deepmind与Isomorphic Labs共同推出新一代AI模型AlphaFold 3,将技术扩展到蛋白质折叠之外,能以前所未有的精度准确预测蛋白质、DNA、RNA、配体等生命分子的结构及相互作用。
团队发表在《自然》杂志的论文称,与现有方法相比,AlphaFold 3预测蛋白质与其他分子的作用至少改进50%,预测一些重要的相互作用类别准确性甚至翻倍。
我们知道,每个动植物和人体细胞内都存在着数十亿台由蛋白质、DNA等构成的“分子机器”,但任何一种分子都无法单独工作。也就是说,AlphaFold 3通过观察它们如何相互作用、组合成数百万种不同的类型,能帮助我们真正理解万物的生命过程。
除此以外,Google DeepMind还基于AlphaFold 3推出了一个易于使用的免费平台——AlphaFold Server,供全世界的科学家利用它进行非商业性研究。
不仅是精确预测结构,在这里,研究人员还能借助AlphaFold 3的强大功能对包含蛋白质、DNA、RNA以及一些配体、离子和化学修饰的结构进行建模,提出大胆的问题,加速工作进程。
这意味着什么呢?
以往通过实验来预测蛋白质结构大概需要四五年时间,且耗资数十万美元。而现在科学家们只需点击几下,就能轻松看到细胞系统的全部复杂性,包括结构、相互作用和修饰。进而了解这些连接如何影响生物功能——比如药物作用、激素产生和维持健康的 DNA 修复过程等。加速药物设计和基因组研究,开启人工智能细胞生物学的新时代,真正地造福人类。
同时,这种惊人的能力也让不少人感慨,AI正在接近成为可以预测和理解生命的“神”?
背后是Evoformer模块和Diffusion技术
根据DeepMind团队介绍,只要给定一系列分子的输入,AlphaFold 3就可以生成它们的联合3D结构,并揭示它们如何相互契合。它不光能模拟如蛋白质、DNA和RNA等大型生物分子,还能模拟包括许多药物类化合物在内的小分子配体。
例如下面的7R6R - DNA结合蛋白:由AlphaFold 3模拟的蛋白质(蓝色)与DNA双螺旋(粉色)结合,跟通过复杂实验发现的真实分子结构(灰色)几乎完美匹配。
不仅如此,AlphaFold 3还能模拟这些分子上的化学修饰。这些修饰控制着细胞的正常功能,一旦受到干扰就可能导致疾病。也就是说,通过模拟分子的化学变化,AlphaFold 3可以预测疾病的发生。
AlphaFold 3的这些能力来源于其新一代架构和涵盖生命体内所有分子的训练。模型核心是改进版的Evoformer模块——一种AlphaFold 2采用的深度学习架构。
在处理输入后,AlphaFold 3使用类似于AI图像生成器的扩散网络生成预测结果。整个过程从一团模糊的原子云开始,经过多个步骤,逐渐去噪,最终形成具体的分子结构。在预测类药分子相互作用方面,AlphaFold 3达到了前所未有的精确度,是真正以全局方式计算整个分子复合物的单一模型。
AlphaFold 3引领药物发现
当这个革命性成果引入物理世界,为药物创新设计带来的贡献将不可估量。
在PoseBusters基准测试中,AlphaFold 3无需任何结构信息输入,就以高于最优传统方法50%的准确率,成为首个在生物分子结构预测方面超越物理学工具的人工智能系统。它在预测蛋白质与配体以及抗体与其靶标蛋白结合上的能力,对于理解人体各类免疫反应和研发新的抗体疗法至关重要。
下图中,AlphaFold 3准确预测了感冒病毒OC43的尖峰蛋白与抗体和糖分子的相互作用,有助于我们深入理解冠状病毒,提升对COVID-19等疾病的治疗效果。
据悉,为了发挥AlphaFold 3在药物设计方面的潜力,Isomorphic Labs已经开始与制药公司合作。结合自主开发的一套辅助AI模型,尝试攻克未解决的新靶点,以期最终开发出能改变患者生活的新疗法。
AlphaFold的前世今生
此次的新模型AlphaFold 3是建立于Google在2020年发布的上一代AlphaFold 2基础之上。后者的最大创新点在于实现了通过端到端的方式,直接从蛋白质序列学习其三维结构,避免了传统方法中的信息丢失问题。
到目前为止,全球已经有数百万研究人员借助AlphaFold 2在包括疟疾疫苗、癌症治疗和酶设计等许多领域取得巨大进展。AlphaFold被引用超过2万次,Demis Hassabis和共同开发者John Jumpe也于2023年获得有“科学界奥斯卡”之称的生命科学突破奖和“诺奖风向标”拉斯克奖,以表彰他们为基础医学研究做出的突出贡献。
但是,AlphaFold 2仍存在一些不足,比如算法的系统偏差和对动态结构变化预测能力有限等。而今天问世的AlphaFold 3比起上一代来,在预测范围、精度和应用领域上都有了飞跃式提升:
与此前局限于蛋白质结构不同,AlphaFold 3还能预测DNA和RNA等分子结构及其完整的相互作用,覆盖更多类型的生物分子,并且具备原子级精度,展现细节显著提升。
这实际是一个重大的技术突破,使得AlphaFold 3可以更好地理解疾病机制,解锁更多科学发现,从开发生物可再生材料到加速药物设计和基因组学研究,应用也更为广泛。
可以说,Alphafold 3的推出,给人们带来的振奋程度远甚于刷新大模型榜的benchmark。
英伟达高级研究经理Jim Fan把AlphaFold-3形容为“人工智能在生物学领域最大突破的最新迭代版本”,并激动地说:
“我们生活在这样一个时代,Llama和Sora等模型的学习成果可以为生命科学研究提供信息和加速发展。这种广泛的通用性简直令人难以置信。同一个Transformer+Diffusion架构不仅可以生成精美的像素,只要你将数据相应地转换为浮点数序列,它也可以想象出蛋白质分子。我们还没有达到单一的AGI模型,但我们已经成功构建了一系列通用的人工智能方法,可以跨领域转移训练数据和神经网络架构。理论上这是行不通的,但谢天谢地它奏效了!”
有人看到了AlphaFold-3模型除生物医药以外,在材料科学领域带来的应用前景。
有人强调这是第一个在精确度上超越基于物理模拟的模型,并且它免费获取,易于使用。“你有很多理由讨厌谷歌,但这绝对不是其中之一。如果让它开源,你将看到奇迹般的化学作用。”
还有评论说这是继ChatGPT发布后最令人兴奋的新闻,“这才是AI造福社会的正确打开方式”。
也是所谓真正意义上的“有效加速”。
Google表示,AlphaFold 3和AlphaFold Server平台将赋能科学家们加快在生物学未解之谜和新研究路线上的发现。“我们才刚开始探索AlphaFold 3的潜力,对今后的发展无比期待。”
一直以来,人类的梦想簿上书写着许多伟大的愿望:攻克癌症、研发新疫苗、战胜罕见病......科学家们前仆后继,一代又一代地努力着。
而现在,人工智能真正化身利器,为人类与时间和疾病的竞速赛跑增添战斗值。对于无数患者而言,更少的时间与科研成本,也意味着更多人能更快速地获得创新药物,带来更多生的希望。
本文来自微信公众号:硅星GenAI (ID:gh_e06235300f0d),作者:张潇雪