基于聚类的多标记选择性集成

作者:张佳欢; 李磊军*; 李美争; 米据生; 解滨
来源:南京航空航天大学学报, 2020, 52(05): 768-776.
DOI:10.16356/j.1005-2615.2020.05.013

摘要

多标记学习和选择性集成是机器学习中的两个热点研究问题。本文利用聚类思想探究多标记学习中的选择性集成,提出了两种具体的多标记选择性集成算法:基于最小距离的簇中心选择算法(Minimum distance based cluster center selection,MDCCS)和基于K-means的簇中心选择算法(K-means based cluster center selection,KMCCS)。在所提出的算法中,如何度量学习器之间的距离是其能否成功的关键因素。本文首先基于学习器的分类结果对其进行重新表示,在此基础上给出了学习器之间距离的计算方式。此外,对于算法中的空簇问题给出了两种解决方法。基于Mulan数据库中的多标记数据集和5种评价指标对所提算法进行了详细的分析,实验结果表明了所提算法的有效性。

全文