摘要

针对传统方法缺乏对查询标准的全面考虑,并且反复运行半监督聚类来更新标签等问题,提出一种基于加权投票一致性的主动密度峰值数据聚类算法。提出一个同时考虑代表性和信息性的主动密度峰聚类算法,选取有代表性的实例捕捉数据模式,查询信息实例以减少聚类结果的不确定性。设计快速更新策略,有效地更新了标签。提出一个结合局部和全局不确定性的主动聚类集成框架,并引入加权投票一致性方法对聚类结果进行优化整合。在数据集上的实验结果证明了该方法能有效解决传统方法问题,并具有良好的聚类性能。