摘要
传统离群点检测算法基本针对集中式数据处理,随着数据规模的不断扩大,传统算法的处理效率已经受限。基于此,提出基于大数据分析的海量数据离群点检测算法,在确定聚类区域、数据集的预处理以及离群点划分的基础上,对其算法定义进行描述,实现对离群度的检测。根据实验结果的对比,设计的算法在检测正确率上相比于传统算法而言,拥有较大优势,具体体现在其算法检测的正确率基本在80%以上,最高可达99%,且随着节点数量的增多,并不对其检测造成消极影响。
-
单位长春工业大学人文信息学院