摘要
蛋白质类泛素化修饰位点的准确识别对基础研究和药物开发都具有重要意义。该文提出了一种基于蛋白质序列特征的类泛素化修饰位点预测模型。该模型结合氨基酸的物理化学属性统计特征和氨基酸序列二元语法模式特征,训练一种轻量型梯度提升机(Light gradient boosting machine, LightGBM)分类器预测某个蛋白质序列的类泛素化修饰位点。该文对比了不同特征的鉴别性,以及不同分类模型的预测性能。在基准数据集上的试验结果证明了该文所提方法的有效性,相比于现有方法在性能上取得了明显的提升,马修斯相关系数为91.64%。
-
单位南京理工大学; 闽南师范大学