摘要

在基于质谱的蛋白质组学数据分类研究中,降维技术能够通过提取特征来降低变量维度,有助于机器学习方法进行准确高效地分类.为了研究和比较机器学习分类器与降维技术相结合的分类模型在蛋白质组学数据分类中的性能,为相关的分类研究提供参考,将线性判别分析、k-最近邻、决策树、支持向量机及人工神经网络分类方法与主成分分析及偏最小二乘降维技术相结合,应用于质谱公共数据的分类中.本文所使用的结合式分类模型中,PLS-LDA,PLS-SVM和PLS-ANN方法表现出了最高的分类准确率.为进一步提升分类效果,基于最优的这3种组合分类方法,采用多数投票法构建了专家分类系统.在10倍交叉验证中,多数投票模型仅使用前5个主...

  • 单位
    复旦大学; 生命科学学院; 蛋白质组学国家重点实验室; 军事医学科学院