摘要
针对从蛋白质的原始序列中提取特征向量的预测精度不高,提出了基于理化性质局部并行融合的特征提取方法。首先,从蛋白质的原始序列计算PSSM矩阵,根据理化性质将PSSM矩阵分成4个区域,进行并行融合;然后,构建蛋白质序列的特征向量,采用主成分分析法提取关键特征信息,构建蛋白质序列对的特征向量。建立了多项式核和高斯核组合核支持向量机预测模型,使用酿酒酵母数据集进行测试,该方法达到93.98%的预测准确率,预测效果优于原始序列特征提取方法。使用独立数据集进行模型泛化性验证实验,也同样表现出了良好的性能。
- 单位