DeepMind 发布 AlphaFold 3:计算生物学领域的又一重大突破

DeepMind 近期再次在计算生物学领域迈出重要一步,发布了 AlphaFold 3 的推理代码库、模型权重以及一个按需服务器。这一更新不仅增强了已具革命性的 AlphaFold 平台的功能,还使其能够超越蛋白质预测,准确预测几乎所有生命分子的结构和相互作用,包括核酸、配体、离子及修饰残基,所有这些都集成在一个统一的平台上。

解决生物分子结构预测的挑战

准确预测生物分子结构是生物学和医学领域面临的最紧迫挑战之一。生物过程,如蛋白质合成、信号传导和药物相互作用,都依赖于复杂的分子结构和精确的相互作用。尽管 AlphaFold 2 已经在蛋白质结构预测方面取得了显著成就,但在处理包含多种分子类型的复合物时仍然存在局限性。传统方法往往局限于特定领域,且计算需求巨大,这限制了快速实验和实际治疗设计的速度。AlphaFold 3 的推出正是为了应对这些挑战,提供一种更通用、更高精度的解决方案。

AlphaFold 3 的发布

DeepMind 发布的 AlphaFold 3 包括了推理代码库、模型权重和一个按需服务器,极大地便利了全球研究人员和开发者的使用。相较于 AlphaFold 2,AlphaFold 3 的架构更为复杂,能够预测包括蛋白质、DNA、RNA、配体、离子乃至化学修饰在内的多种生物分子复合物的结构。此版本特别设计用于捕捉生物系统中的复杂相互作用,同时发布的模型权重也使得研究人员可以直接复制或扩展现有成果。

按需服务器则让没有大规模计算资源的研究机构和个人也能轻松访问 AlphaFold 3 的强大功能。用户只需提供序列或结构输入,即可获取高精度的结构预测结果,极大降低了技术门槛。

技术细节

AlphaFold 3 引入了一种基于扩散模型的新架构,显著提升了预测生物分子相互作用的准确性。不同于 AlphaFold 2 主要聚焦于蛋白质,AlphaFold 3 的通用架构能够预测更广泛的生物分子类型。其中心处理模块“pairformer”替代了 AlphaFold 2 中的“evoformer”,简化了处理流程并提高了效率。通过直接预测原子坐标,AlphaFold 3 消除了早期模型中额外的扭转角预测和立体化学处理步骤。

扩散模型的多尺度特性有助于减少立体化学损失并免除多序列比对的需求,从而提高了预测的准确性。根据基准测试,AlphaFold 3 在蛋白质-配体相互作用和蛋白质-核酸复合物预测方面明显优于传统工具,如 AutoDock Vina 和 RoseTTAFold All-Atom。

发布的意义

AlphaFold 3 的发布在多个层面上具有里程碑式的意义。首先,它填补了涉及多种分子类别复杂生物分子相互作用理解上的关键空白。AlphaFold 3 的新架构能够建模几乎所有的复杂结构,如蛋白质数据库(PDB)中记录的结构。例如,AlphaFold 3 在预测抗体-抗原相互作用、蛋白质-配体结合和核酸相互作用方面表现出色,在 PoseBusters 和 CASP15 RNA 目标等数据集上取得了显著的准确性提升。

随着按需访问性的提高,AlphaFold 3 推动了对复杂蛋白质-DNA 或蛋白质-配体相互作用相关疾病(如癌症和神经退行性疾病)的研究。它能够处理复杂的化学修饰,并在存在修饰(如糖基化或磷酸化)的情况下准确预测结构,这对于药物设计和发现至关重要。因此,AlphaFold 3 加速了计算模型在治疗研究中的应用,提升了我们在分子层面设计精准干预措施的能力。