摘要

现有成对约束半监督聚类算法(CE-s SC)克服了极大熵聚类(MEC)算法不能利用样本成对约束信息的缺点,但CE-s SC算法的惩罚项中各熵项之间相互干扰,不利于惩罚项系数的选择。为克服此问题,基于相对熵提出了一类新的半监督聚类算法(PD-s SC),并把表示成对约束样本信息(外部信息)的相对熵项推广到了功效散度(PD)族。此时,PD指标可取任意的实数,当成对约束数较少时,可通过调整PD散度指标来选择比对比算法表现更好的PD-s SC算法。实验结果显示了PD-s SC算法的优良性质,PD-s SC算法惩罚系数的选择也比CE-s SC算法简单且高效。