摘要
基因芯片数据具有维数高、样本少、高冗余的特点,以基因芯片数据进行特征选择及分类处理为研究对象。粗糙集理论能很好地消除冗余数据,但它不适应连续型的基因芯片数据,通过基于邻域粗糙集模型的方法能很好地解决这一问题,但如何选择好邻域半径来提高分类效率一直没有固定的方法。从各条件属性标准差来得到一组邻域半径,进而得到各样本邻域。经典的芯片数据实验表明:基于优化的邻域半径组比传统设定单一的邻域半径能取得较好的分类效果,和传统的特征选择算法做比较也能得到较少的特征基因和较高的分类能力。
-
单位仰恩大学