摘要

集体差异性被认为是集成学习中的一个关键因素.在聚类集成的研究中,生成聚类集体的方法有许多种,但就专门致力于生成高差异性聚类集体的方法研究较少.基于此,本文提出生成高差异性聚类集体的方法 CEAN和 ICEAN,在算法中通过引入人工数据来增加聚类集体的差异性.用实验比较了 CEAN 和 ICEAN 与文献中出现的常用聚类集体生成方法,实验表明 CEAN 和 ICEAN 确实能增加生成集体的差异性,从而在相似平均集体成员准确度情况下使得聚类集成的效果更好.