摘要
针对基因表达谱数据的特点,提出了一种基于样本加权的基因特征选取模型.首先提出一种样本权重的计算方法;其次结合样本权重改进信息增益度量标准,并用其衡量基因信息量的大小,同时将基因之间信息量的重复性视为基因噪声干扰,建立未消噪和消噪的基因特征选取模型;最后结合支持向量机、逻辑回归、神经网络和决策树4种分类器,将所提模型与常见的基因选取模型进行比较分析.实验结果表明,所提选取模型在不影响分类性能的前提下,具有较好的稳定性.
-
单位网络与交换技术国家重点实验室; 北京邮电大学