基于DPRI的单行为强化聚类算法

作者:张龙; 李凤莲; 张雪英; 史凯岳
来源:电子设计工程, 2022, 30(12): 31-37.
DOI:10.14022/j.issn1674-6236.2022.12.007

摘要

针对基于划分的聚类算法对初始聚类中心较为敏感的缺陷以及样本划分方式导致算法时间复杂度较高的问题,通过引入强化学习中的学习机制,结合DPRI算法中的离散化奖励技术,提出一种基于DPRI的单行为强化聚类算法。该算法把聚类任务转化成强化学习任务,通过智能体不断“探索”和“利用”的过程,使算法具有了一定的自我学习能力,该算法以平均类内距离的变化趋势作为发送反馈信号的依据,智能体接收到信号后不断更新Q表,最终达到稳定状态,输出聚类结果。使用K-means、K-means++、FCM以及最近提出的LAC算法在准确率、DB指数、轮廓系数以及运行时间等指标上进行对比实验。结果表明10个数据集中,文中算法在6个数据集上准确率最高、DB指数最优,在5个数据集上轮廓系数最高。时间复杂度方面,文中算法处理中规模和大规模数据的运行时间降低了一个数量级。

全文