APS | 上海药物所综述扩散模型在AI辅助的抗体设计中的应用

2024年9月30日,中国科学院上海药物研究所徐华强团队在Acta Pharmacologica Sinica发表综述文章“AI-driven antibody design with generative diffusion models: current insights and future directions”。本综述总结了扩散模型在AI辅助抗体设计中的应用,包括抗体的从头设计、已有抗体结构的优化、以及相应的实验评测方法,系统地总结了基于扩散模型的抗体生成领域的研究进展,并为进一步改进针对抗体设计的扩散模型提供了参考。


抗体是不可或缺的免疫系统组成部分,也是现代大分子药物设计最重要的部分,然而抗体药物的研发和优化通常面临花费多、周期长、优化难等实验相关的问题,亟待先进的计算方法提供支持和辅助。快速发展的人工智能(AI)模型已经在多种任务中起到了关键作用,而扩散模型作为AI领域的后起之秀,不仅对图片和视频生成产生了革命性改变,也已经在蛋白质设计、小分子设计等药物设计领域发挥了作用。鉴于扩散模型能够高效学习大量高质量数据的分布,并且能够根据提示词生成相关数据的特点,其在抗体设计领域中,尤其是用抗原作为“提示词”生成抗体方面,具有天然的优势。为此,本文综述了扩散模型在抗体设计领域的应用,以辅助架起抗体设计方面计算和实验的桥梁。


图1.如何在抗体设计任务中使用扩散模型

抗体设计任务主要包括两方面,分别是从头抗体设计和抗体优化。图2展示了一些从头抗体设计方法。其中针对抗体的RFDiffusion在抗体和蛋白训练数据上进行了微调,并结合ProteinMPNN方法设计CDR序列,基于语言模型提取隐空间信息的思路在AntiBARTy Diffusion和EAGLE上也得到了应用,AbDiffuser则尝试通过设计新的模型架构来整合抗原-抗体相互作用的序列和结构信息。在从头抗体设计上,这些思路都取得了一定成果,包括实验上微摩尔级别的亲和力,或设计了和上市药物相媲美的新抗体。

图2.在从头抗体设计中应用扩散模型

而针对已有抗体的优化问题,研究者们不仅可以使用针对抗体专门设计和训练的,基于结构或基于序列的模型(如DiffAb或NOS)来从抗原-抗体复合物结构出发生成新的抗原结合区,还可以使用通用的蛋白质设计模型(如基于结构的RFdiffusion、Chroma或者基于序列的EvoDiff、Taxdiff),这样的模型将生成新的结构或序列,后续可以在计算或实验方法上进一步评价所生成的蛋白质。该综述还讨论了如何在结构、序列、结合亲和力估计和实验方法上评测所生成的抗体。

图3.利用通用的蛋白质生成模型优化抗体

综上所述,扩散模型的应用为加速抗体设计提供了新途径,主要包括利用高质量的大数据集,来捕捉界面的复杂相互作用和探索更广阔的序列空间。尽管仍面临一些挑战,如负样本的缺失,计算估计方法的准确度有限,抗体成药性的评估等,但AI方法的不断完善进步和相关数据库的扩充,有望进一步提高基于扩散模型的抗体设计的精确性和有效性,最终使其成为生物技术领域的优质工具。

上海药物所博士研究生何欣恒、助理研究员李俊睿为本文共同第一作者;上海药物所徐华强研究员为本文通讯作者。本研究得到了国家自然科学基金,中国科学院战略性先导科技专项,上海市市级科技重大专项和临港实验室的基金资助。

全文链接:https://www.nature.com/articles/s41401-024-01380-y