Nat Commun | 上海药物所开发糖结合位点预测精准新算法DeepGlycanSite

2024年6月17日,中国科学院上海药物所糖测序联合交叉攻关团队程曦研究员和文留青研究员等与临港实验室青年研究员王鼎言合作,在Nature Communications发表了题为“Highly accurate carbohydrate-binding site prediction with DeepGlycanSite”的研究成果。该研究通过开发基于深度学习模型的糖结合位点预测算法DeepGlycanSite,精准预测蛋白质结构上的糖类结合位置,帮助解决糖类与蛋白质相互作用的难题。

糖类是生命活动中不可或缺的物质。糖类不仅为生物体提供能量供应和结构支撑,还通过调控生物大分子的功能,在免疫响应、细胞分化和神经发育等过程中发挥关键作用。但是,由于糖类物质种类多样且结构复杂,实验鉴定蛋白质的糖类配体结合位点成本高、效率低。这阻碍了糖类分子作用机制的研究和糖类药物的研发。已有的小分子配体结合位点预测算法不适用于糖结合位点预测。因此,开发精准高效的糖结合位点预测方法是糖科学领域的迫切需求。

针对糖结合位点预测问题,研究团队创新性地设计了基于深度等变图神经网络的算法DeepGlycanSite。DeepGlycanSite从用户提供的(实验或预测)蛋白质结构中提取几何与进化信息,利用向量化表示和交互式信息传递机制深度挖掘特征关联性,以预测每个氨基酸位点结合糖的概率(图1)。目前已有的结合位点预测算法在糖结合位点预测任务上均表现不佳,准确度小于0.30,马修斯相关系数(MCC)小于0.35。DeepGlycanSite显著优于这些算法,准确度和MCC分别达到0.63和0.63,且能预测不同类型糖的结合位点(图2)。


图1 DeepGlycansite网络架构

图2 代表性单糖、二糖和寡糖结合位点预测。DeepGlycanSite、DeepPocket和PeSTo的预测位点分别以绿色、黄色和青色表示。糖分子结合位置表示真实的糖结合位点。

此外,DeepGlycanSite可以进一步读取用户提供的糖分子化学结构信息,预测该糖分子的特异性结合位点。在针对炎症潜在靶标嘌呤能受体P2Y14的应用案例中,DeepGlycanSite成功鉴定出了核苷糖的特异性结合位点。相关算法已在GitHub上开源(https://github.com/xichengeva/DeepGlycanSite.git)。这一突破为解析糖与蛋白质相互作用提供了精准的计算工具,有助于糖类药物设计。

上海药物所博士研究生何欣恒、实验师赵丽芬、助理研究员田银平为本文第一作者;上海药物所程曦研究员、文留青研究员和临港实验室青年研究员王鼎言为本文共同通讯作者。本研究工作曾得到上海药物所蒋华良研究员、郑明月研究员、徐华强研究员和高召兵研究员,以及西安交通大学王裕淞博士和香港中文大学李绍宁博士的支持和帮助。本研究得到了上海市糖专项、国家重点研发计划、中国科学院青促会和临港实验室的基金资助。

全文链接:https://www.nature.com/articles/s41467-024-49516-2