摘要
针对密度聚类算法在聚类过程中存在的参数设置敏感、收敛时间长等问题,提出了一种改进密度聚类算法。首先使用自定义密度公式计算样本密度,得出候选代表点集合;再选取与其它候选代表点距离之和最小对象为首个初始聚类中心,使用最大乘积法完成初始中心选择;在簇中心更新环节,将与簇内均值最小距离的对象作为该簇的临时中心,使用最小距离法划分样本至所属簇中;重复该环节,直到收敛。在UCI数据集上的测试结果表明,改进密度算法相对K-means算法和其它两种改进算法具有更好的稳定性、更高的聚类准确率和更少的聚类耗时。
- 单位