摘要
多标记学习和选择性集成是机器学习中的两个热点研究问题。本文利用聚类思想探究多标记学习中的选择性集成,提出了两种具体的多标记选择性集成算法:基于最小距离的簇中心选择算法(Minimum distance based cluster center selection,MDCCS)和基于K-means的簇中心选择算法(K-means based cluster center selection,KMCCS)。在所提出的算法中,如何度量学习器之间的距离是其能否成功的关键因素。本文首先基于学习器的分类结果对其进行重新表示,在此基础上给出了学习器之间距离的计算方式。此外,对于算法中的空簇问题给出了两种解决方法。基于Mulan数据库中的多标记数据集和5种评价指标对所提算法进行了详细的分析,实验结果表明了所提算法的有效性。
- 单位