摘要

蛋白质复合物是不同蛋白质链通过相互作用形成的,自然界中很多蛋白质通过形成复合物而执行功能,因此准确地预测复合物的结构对于理解和掌握功能至关重要。近两年来,单条蛋白质链的结构预测有了突破性的进展,从氨基酸序列出发预测蛋白质结构的水平大幅提高。但相较于单体蛋白质,蛋白质复合物结构预测的准确性仍然较低。本文旨在总结蛋白质复合物结构预测的相关算法以及介绍最新进展。首先简要介绍蛋白质结构预测领域的相关人工智能算法,主要包括共进化分析与蛋白质接触预测、深度学习方法与蛋白质结构预测、预训练模型与蛋白质表征学习几个方面;其次系统总结了蛋白质复合物链间相互作用预测的基本方法,从复合物的多重序列比对构建到对于同源或异源复合物的链间残基接触预测;最后从相互作用位点指导复合物结构预测、蛋白质分子对接算法、端到端的复合物结构预测方法等方面阐述了蛋白质复合物结构预测的基本方法和思路。总体来说,目前蛋白质复合物结构预测精度不够高,有效地解决多重序列比对的配对和多聚体复合物模板搜索等问题,或者在大量的序列或结构数据上结合预训练模型的新范式,是一个合理而有效的方案。提升蛋白质复合物结构预测水平在合成生物学领域如抗体设计、药物发现等方面有很好的应用前景。