摘要
为了获取理想的局部离群点检测效果,提高稀有类占比与F-Measure值,提出基于分形理论的异质网络中局部离群点检测方法,挖掘局部离群点中高价值的隐藏信息。根据分形理论中广义维数及多重分形概念,使用基于Z-ordering的多重分形维数算法,计算异质网络数据集的多重分形广义维数。在此基础上,将局部离群点检测问题转化为优化分割问题,建立基于分形理论的异质网络中局部离群点检测优化模型,以贪婪算法为思想,运用FDOM算法求解该优化模型,实现局部离群点检测。实验结果表明,上述方法检测出的局部离群点中稀有类数据占比始终保持最高,且上升速率较快,检测效果最佳;该方法检测异质网络中不同数据类别的局部离群点所得F-Measure值始终高于传统方法,具有理想的检测性能。
- 单位