摘要
在文本分类过程中,为了提升特征过滤法的性能,基于相对判别准则(RDC),提出一种采用多变量形式的改进方法。首先,使用RDC度量计算每个特征的相关值;然后,考虑多个特征变量之间的依赖关系,使用Pearson关联以计算特征之间的关联值。同时,利用最小冗余和最大相关的概念,对冗余特征进行约简。最后,选出特征子集,作为后续分类的要素。所提方法在3个数据集上进行实验评价。结果表明,在大部分情况下,所提方法在精度、召回率和F度量方面的分类性能优于其他方法,且复杂度适中。
-
单位齐鲁师范学院