摘要
多标记特征选择是机器学习和人工智能领域的研究热点之一,现有多标记学习的研究是假设每个示例的标记呈均匀分布,即每个示例的各个相关标记的重要程度相同.然而,在许多应用领域中这些相关标记的重要程度往往不同.为此,本文提出了一种标记增强方法,可将多标记数据中传统的逻辑标记转化为监督信息更丰富的标记分布;同时,从代价敏感学习视角,构造了基于特征代价与特征依赖度的特征重要性度量准则,在此基础上,设计了面向标记分布数据的代价敏感特征选择算法;最后,通过在真实的多标记数据集上的实验对比与分析,验证了算法的有效性和可行性.
- 单位