摘要
针对目前算法对数据进行离群点挖掘时,由于未能在数据挖掘前提取相关数据特征,导致该算法在进行数据挖掘时,存在挖掘时间长、挖掘效果差以及挖掘性能低的问题,提出一种基于谱聚类的不确定数据集中快速离群点挖掘算法。该算法先依据不等长序列计算数据的相似程度,并使用偏最小二乘法完成不确定数据集的特征提取;再基于谱聚类算法对数据特征进行计算,获取数据的离群指数;最后通过离群指数完成不确定数据集的离群点挖掘。实验结果表明,使用该算法挖掘数据离群点时,挖掘时间较短、挖掘效果较好、挖掘性能较高。
-
单位山西大同大学; 大同大学教育科学与技术学院