摘要
蛋白质磷酸化翻译后修饰在病毒的复制和抑制宿主细胞功能方面发挥重要的作用。然而,利用实验的方法识别磷酸化位点既费时费力又耗财。因此基于蛋白质氨基酸序列发展一种机器学习方法对病毒蛋白磷酸化位点进行预测显得非常有必要。研究结合支持向量机提出识别病毒蛋白磷酸化位点的新方法。采用权重氨基酸成分和属性分组编码对病毒蛋白残基的氨基酸物理化学性质和序列信息进行特征提取,通过10倍交叉验证,丝氨酸、苏氨酸和酪氨酸磷酸化位点的预测准确率分别达到82.0%、85.8%和92.4%。运用该预测模型对丝氨酸残基磷酸化的激酶组进行分类评估,CMGC、AGC和CAMK激酶组的马氏相关系数分别达到69.3%、68.8%和68.2%。结果表明:构建的方法可以有效地预测激酶特异性的磷酸化位点。
- 单位