摘要
深度神经网络因其强大的非线性映射和特征提取能力被广泛应用于聚类中,然而,现有的大多数深度聚类网络仅仅考虑了样本的特征信息,并未有效利用样本空间位置的分布以及样本间的关联信息.本研究融合了样本的特征信息以及样本间的空间位置信息和关联关系,提出了自适应边缘样本识别的深度聚类算法(Auto-CB).在使用自编码器学习样本特征表示的同时,通过图神经网络学习样本间的结构信息;然后利用自注意力机制自适应地将样本划分为簇中心样本和边缘样本,并分别使用K-means和多数投票机制对其聚类;在5个数据集上与7个深度聚类以及基于图神经网络的聚类算法进行了性能对比.结果表明,利用簇中心样本与边缘样本之间的潜在关联关系可以有效促进样本的特征表示,并在聚类任务中取得了更好的效果.
- 单位