粗糙互信息的不平衡多标记特征选择算法

作者:陈飞; 史金成
来源:安庆师范大学学报(自然科学版), 2021, 27(01): 40-58.
DOI:10.13757/j.cnki.cn34-1328/n.2021.01.009

摘要

特征选择作为处理多标记学习中数据高维性的一种有效方法,得到了众多学者的研究与关注。由于部分特征仅仅与某些标记有着强相关性而与整个标记空间的相关性不强,不能简单通过与标记空间整体的相关性判断取舍。此外,多标记的分布是不平衡的。因此,根据标记密度对标记空间进行划分,并分别进行相关性的判断,同时在不同标记空间进行不同比例的采样。引入具有补的性质的粗糙熵代替传统熵的度量方式,提出了基于粗糙互信息的不平衡多标记特征选择算法,在5个公开数据集上的实验结果表明了算法的有效性。

全文