摘要

固有无序蛋白(简称IDPs)在生理条件下不具有稳定的二级或三级结构,但是在生物体内通过与结合配体相互作用来发挥重要的生物学功能,故研究固有无序蛋白与配体的相互作用,对理解这些蛋白的功能具有重要的生物学意义。本文基于IDPsBind数据库,获得固有无序蛋白与5类配体分子(DNA,RNA,金属离子,肽,小分子)结合的结合位点,然后对这些结合位点处残基出现在5类结合位点的倾向性进行分析,结果发现:5类配体分子的结合位点处氨基酸的分布是不一样的。然后,利用滑动窗口中心残基的结合配体类型,建立5类结合配体的结合位点数据集,并提取四种特征参数:位置特异性矩阵(PSSM),20种氨基酸组分(AAC),以及残基的疏水性(HP)和溶剂可及表面积(SASA)特征,结合机器学习算法对5类结合位点进行分类识别,在5折交叉检验结果中预测准确率(Acc)最高达到87%,当特征融合后,预测准确率(Acc)达到88.3%。该研究结果对固有无序蛋白与结合配体相互作用的分析提供了很好的参考。

全文