摘要

随着云时代的来临,大数据的运用也得到了越来越多的关注。大数据的核心内容就是发现数据中隐含的价值链,为决策过程提供可借鉴的参考。聚类算法是数据挖掘的一个归类方法,而K-means是以划分为基础的聚类算法。在网络安全监测中,通过使用由K-means构建的网络安全监测模型,可以显著提升在大数据条件下提取数据的可靠性,减少检测误报率,从而减少网络安全异常数据的选取时间。由于传统的K-means算法在数据类型预处理、初始节点选择以及K值选择等方面存在不确定性,造成了入侵检测的效率下降,本文对传统的K-means聚类算法实行改进,并结合使用KDDCup99数据集进行试验,表明改良后的K-means算法的检测精度和测量效果要优于传统算法。