摘要
自然界生物中,大约有超过三分之二的真核蛋白质含有多个结构域。虽然AlphaFold2已经实现了端到端的蛋白质结构预测的重大突破,对于单域的静态蛋白质结构的预测精度几乎达到了实验测定的水平,但是对于多域蛋白质结构的预测精度仍然有待提高。本文提出了一种名为MDDpre的多域蛋白质残基距离预测方法。首先从多序列比对和模板中提取了序列谱、位置熵、互信息、去除背景噪声的互信息、平均接触势能、MSA特征矩阵、行注意力矩阵以及模板域间距离特征,然后设计了一个集合了三角形更新、轴向注意力机制和卷积残差块的网络来预测多域蛋白质的域间和域内距离。在62个多域蛋白质的实验结果表明,MDDpre优于现有的方法,能够有效提升多域蛋白质的残基距离预测精度。
- 单位