基于聚类离群因子和相互密度的离群点检测算法

作者:张忠平; 邱敬仰; 刘丛; 朱梦凡; 章德斌
来源:计算机集成制造系统, 2019, 25(09): 2314-2323.
DOI:10.13196/j.cims.2019.09.018

摘要

针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。

全文