摘要

化合物-蛋白质互作的鉴定对药物发现、靶标鉴定、网络药理学和蛋白质功能的阐明等至关重要。本文开发了一种基于表示学习的图神经网络预测化合物-蛋白质互作模型。首先利用Word2vec表示学习方法自动提取化合物和蛋白质的特征;然后将特征输入构建图神经网络预测模型,并与传统机器学习方法和前人的方法对比,结果显示模型在AUC、准确率等评价指标上表现出更好的结果。预测Binding-DB数据库中所有未知的化合物-蛋白质互作对的概率,其中预测得分排名前五的化合物-蛋白质互作对中有四个得到了外部证据的验证,进一步证明了模型的鲁棒性和有效性。本模型可以充分利用聚合邻居信息、节点特征和自适应地捕获化合物-蛋白质空间的拓扑结构,从而实现较高的模型精度。本研究成果为化合物和蛋白质互作鉴定的研究提供了新的思路和方法。