集成特征选择方法在基因表达数据上的应用

作者:杜冲; 周长银*; 李悦; 李潇宁
来源:山东科技大学学报(自然科学版), 2019, 38(01): 85-90.
DOI:10.16452/j.cnki.sdkjzk.2019.01.010

摘要

基因表达数据的研究是生物医学上的一个重要课题。基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤。单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,并将此模型应用到3个不同的基因表达数据集上。为了评价特征子集的分类预测性能,使用支持向量机作为分类器进行测试。实验结果表明:相对于单一的特征选择方法,集成特征选择能够有效提高分类模型准确度。

全文