理解生物分子相互作用对于药物发现和蛋白质设计等领域至关重要。传统上,确定蛋白质和其他生物分子的三维结构需要昂贵且耗时的实验室实验。2024年推出的AlphaFold3通过展示深度学习可以在预测生物分子结构(包括复杂相互作用)方面达到实验级别的准确性,彻底改变了这一领域。尽管取得了这些进展,但在三维空间中准确建模不同生物分子之间的相互作用仍然是一个挑战。复杂的相互作用,如蛋白质、核酸和配体之间的相互作用,继续带来困难,留下了结构生物学中的一个重大差距。
Boltz-1简介
为了解决这些挑战,麻省理工学院(MIT)的研究团队推出了Boltz-1,这是第一个在预测生物分子复合物方面达到AlphaFold3级别准确性的开源且商业可访问的模型。与前代产品不同,Boltz-1完全向公众开放,模型权重、训练和推理代码在MIT许可证下发布。这种开放性旨在促进全球合作并推进生物分子建模。
技术细节
- 架构创新:
- 多序列比对(MSA)配对算法:Boltz-1使用了一种新颖的算法来配对MSA,利用分类信息来提高序列比对的密度和质量。这种方法使Boltz-1能够捕捉到对准确预测生物分子相互作用至关重要的共进化信号。
- 统一的裁剪方法:优化了训练过程,平衡了空间和连续裁剪策略,以增强训练数据的多样性。
- 增强的置信度模型:通过允许部分关于结合口袋的信息,增强了其预测相互作用的能力,使其高度适应现实场景。
- 高效的数据处理:
- 多任务学习:Boltz-1通过多任务学习方法,同时优化多个目标函数,提高了模型的泛化能力和鲁棒性。
- 并行计算:利用并行计算技术,显著减少了训练和推理的时间,提高了计算效率。
影响和基准性能
Boltz-1的推出具有重要意义。通过使能够预测复杂生物分子结构(达到AlphaFold3级别)的模型民主化,Boltz-1有可能加速药物设计、结构生物学和合成生物学等领域的发现。
- 基准测试:
- CASP15(蛋白质结构预测竞赛):在蛋白质-配体和蛋白质-蛋白质预测任务中,Boltz-1展示了强大的性能,LDDT-PLI达到65%,而Chai-1为40%。
- DockQ成功率:Boltz-1的DockQ成功率为83%,超过了Chai-1的76%。
- 小分子结合口袋对齐:Boltz-1在将小分子与其各自的结合口袋对齐方面表现出色,展示了其在复杂相互作用预测中的优势。
- 实际应用:
- 药物发现:Boltz-1可以帮助研究人员快速预测药物分子与靶标蛋白的结合模式,加速药物设计和筛选过程。
- 结构生物学:通过准确预测蛋白质复合物的结构,Boltz-1有助于揭示生物分子的功能和机制。
- 合成生物学:Boltz-1可以用于设计新的蛋白质和生物分子,推动合成生物学的发展。