摘要

经典的APCKmeans(active pairwise constrained K-means)算法通过主动学习的方式构造must-link约束集和cannot-link约束集作为监督信息进行半监督聚类,提高了结果的准确性.但该算法在样本指派的过程中可能出现指派不是当前最优的问题.提出一种优先指派标签样本的方法,应用于APCKmeans算法,使用改进后的APCKmeansI算法实现了使用较少的监督信息取得更好的聚类结果.将改进策略应用于PCKmeans(pairwise constrained K-means)算法,提出改进后的PCKmeansI算法.通过在UCI基准数据集的实验表明,改进后算法的性能得到明显提升.

  • 单位
    河北地质大学