摘要
本发明提出了一种基于自适应LASSO的特征选择方法,适用于对具有高维度、低样本量特点的基因微阵列数据进行特征选择的问题。首先,计算每个特征向量和分类标签各自的信息熵以及特征和标签之间的条件熵,以此得到每个特征向量与分类标签之间的对称不确定度;然后,根据同类样本之间的特征表达差异度较小、异类样本之间差异度较大的原则,用ReliefF算法计算每个特征的同异类差异度;最后,分别将上述两种评价指标作为自适应LASSO算法的特征权重进行特征选择,将得到两批特征子集合合并生成最终筛选出的特征集合。
- 单位