摘要

针对传统多视角聚类算法难以准确识别噪声和有效划分类间重叠区域样本的问题,提出一种基于证据多视角的模糊C-means聚类算法(a fuzzy C-means clustering algorithm based on multi-view of evidence, EMVFCM)。首先,在证据推理框架下,研究一种改进的模糊C-means多视角聚类算法,通过优化改进的目标函数获得待测样本属于单类和噪声的信任值,从而识别出噪声数据。然后,由于重叠区域的样本不能被准确地划分类别,所以将其划分到相对应的复合类,这不仅能够表征数据样本类别的不精确性,还能降低错误分类的风险。最后,通过人工数据集和UCI数据集验证本文算法性能并与相关算法对比,实验结果表明本文算法较传统多视角聚类算法能够更有效地处理数据中的噪声和重叠样本难以准确划分的问题。

全文