摘要

对模糊C-均值聚类算法(FCM)改进及在异常检测中的应用进行研究,提出了一种基于改进蜻蜓优化多核模糊聚类算法的异常检测方案.针对FCM聚类个数事先确定,对噪声、不同形状聚类鲁棒性差以及初始聚类中心敏感的缺陷,设计最佳多核聚类策略,通过采用加权多核度量和最佳聚类评价指标,在实现自适应数据聚类个数确定的同时,证明对不同聚类问题具有更好的鲁棒性;提出密度峰值聚类中心初始化机制,通过迭代计算密度峰值函数,对聚类中心进行初始化;引入蜻蜓算法(DA),对DA迭代进化机制进行改进,并将聚类中心等效为蜻蜓个体编码,充分利用DA全局寻优优势,以改善FCM聚类性能;搭建MPI并行运算架构,将最佳多核聚类策略和蜻蜓算法局部搜索更新进行分布式计算处理,以提高数据聚类的运行效率.最后,将改进蜻蜓优化多核模糊聚类算法(IDM-FCM)应用于异常检测.仿真结果表明,对于不同形状以及孤点聚类问题,IDM-FCM具有更好的聚类效果,聚类正确率提高了约19.1%,而且,基于IDM-FCM的异常检测算法具备更高的检测能力,检测成功率提高了约5.2-39.2%,误报率降低了了约70.2-92.3%.