摘要

目的:构建一种基于深度神经网络的“药物-靶点”亲和力预测方法。方法:先对拟定药物进行独热编码,并使用预训练语言表征模型对靶蛋白进行编码,以捕获氨基酸序列中的重要信息,然后设计2个独立的卷积神经网络,通过4个全连接层来预测“药物-靶点”的亲和力。最后在Davis激酶结合亲和力数据集和KIBA大规模激酶抑制剂生物活性数据集上验证本方法的性能,并将实验结果与KronRLS、SimBoost、DeepDTA算法结果进行比较。结果:相较于KronRLS、SimBoost、DeepDTA算法,本方法在Davis激酶结合亲和力数据集和KIBA大规模激酶抑制剂生物活性数据集上均获得了最高的一致性指数和最低的均方误差值。结论:采用双向语言模型对靶蛋白进行编码后再进行深度学习,可以提高“药物-靶点”亲和力预测的准确度。