摘要
关键蛋白质识别是当前计算生物学领域的一个研究热点和难点。通过计算方法识别关键蛋白质的方法主要有DC,BC,LAC,PeC,ION和LIDC等。现有方法的识别准确率还有待进一步提高,主要原因是其仅使用了蛋白质相互作用网络单一数据源,以及蛋白质相互作用网络中存在许多假阳性和假阴性数据等。为了提高识别准确率,提出一种高效识别方法PSHC。首先,PSHC方法首次把结构洞理论引入到关键蛋白质识别方法中;其次,融合了蛋白质相互作用网络和蛋白质复合物两种数据源用于识别关键蛋白质。在真实数据上的实验结果表明,与其他传统方法相比,PSHC方法可以识别更多关键蛋白质,并且敏感度、特异性、准确性、阳性预测值、阴性预测值、F测度等统计指标也明显高于其他方法。
- 单位