摘要

一致性聚类本质上是一个组合优化问题,这已经被证明是NP完全型难题,主要困难在于从不同聚类算法的输出结果中求出一个共识聚类。在通过单个簇标记变化来更新目标函数的基础上,提出基于深度Q网络的一致性聚类方法。不同于贪心和启发式方法,该方法将一致性聚类问题形式化为马尔科夫决策过程来优化目标函数。首先将一致性聚类问题定义为强化学习任务,然后利用深度强化学习方法 DQN求出一致性聚类,同时调研了15种聚类外部指标以构建目标函数,比较不同指标在提出的框架上的性能差异。在UCI数据集上的实验结果表明,该方法有效且在多种指标上取得了较好的聚类效果。