复杂分布数据的半监督阶段聚类

张俊溪; 吴晓军; 蒋江红

摘要

半监督聚类是一种用先验信息完善聚类过程的机器学习方法。通过将元胞自动机(cellular automata,CA)距离变换算法引入到半监督聚类过程中,采用平面距离变换算法将数据集划分为若干子类,获得聚类数和约束信息,并作为下一阶段聚类的先验信息。利用半监督K-means聚类算法对第一阶段的聚类结果做进一步划分,可以获得完整的聚类中心和聚类数,并由此提出CA-K-means二阶段聚类算法。采用3组人工数据集和3组标准UCI数据集进行对比仿真实验,将CA-K-means二阶段聚类算法与半监督K-means聚类算法、遗传Kmeans聚类算法和单纯的CA层次聚类算法进行对比,结果显示,该算法对复杂分布数据的聚类准确率较高,聚类性能更加优良。

单位
西北工业大学; 陕西师范大学; 西安航空学院; 自动化学院

收藏分享被引浏览

更新时间：2024-05-13 02:47

复杂分布数据的半监督阶段聚类

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友