摘要

质谱技术常用于疾病预防和诊治,但质谱数据特征数量庞大,不同疾病之间特征千差万别,使得多疾病诊断任务复杂困难。针对上述问题,本文提出了基于质谱数据的生成对抗自编码器整合投票算法msDAGVote。使用基于双自编码器的生成对抗网络作为msDAGVote的特征提取框架,在输入质谱数据训练后,生成器子网络用于特征构造,最后通过整合投票特征选择算法对构造特征进行筛选,将获得的最优特征子集用于多疾病诊断。在10种不同疾病类型的质谱数据集上进行评估,实验数据表明,msDAGVote提取的特征优于比较方法,显著缩减分类所需特征数量的同时具备优秀的疾病分类诊断能力,在6个数据集上分类AUC超过0.98,在其余具有挑战性的数据集上超过0.87。

全文