摘要

近期AlphaFold等研究使得深度学习在药物分子链接蛋白质靶位(DTA)任务上取得极大关注,但现有工作多将分子单一结构嵌入为向量,忽略了多视角融合分子特征对最终特征表示提供的信息增益。针对单一结构分子存在特征不完备性的问题,提出了一种基于注意力融合多视角分子特征预测药物-靶标链接亲和力的端到端深度学习方法。其核心工作在于多视角分子结构嵌入(Mas)和多注意力特征融合(Mat)。首先,Mas模块将多视角分子结构嵌入到特征向量空间;然后,Mat模块融入分子特征层级的注意力机制对不同视角的分子特征加权融合;其次,根据药物-靶标相互作用执行两者特征级联;最后,利用全连接神经网络回归预测亲和力。在Davis和KIBA数据集上实验验证训练比率、多视角特征融入、注意力融合、以及相关参数对亲和力预测性能的影响。与GraphDTA方法相比,均方误差(MSE)在两个数据集上分别降低了4.8%和6%。实验结果表明,注意力融合多视角分子特征能够捕获对蛋白质靶位上链接相关性更高的分子特征。