摘要

多标签数据广泛存在于现实世界中,多标签特征选择是多标签学习中重要的预处理步骤。基于模糊粗糙集模型,研究人员已经提出了一些多标签特征选择算法,但是这些算法大多没有关注标签之间的共现特性。为了解决这一问题,基于样本标签间的共现关系评价样本在标签集下的相似关系,利用这种关系定义了特征与标签之间的模糊互信息,并结合最大相关与最小冗余原则设计了一种多标签特征选择算法LC-FS。在5个公开数据集上进行了实验,实验结果表明了所提算法的有效性。