摘要

为提高网络安全数据分类的准确性,对网络安全数据分类加以优化。首先通过K均值(K-means)聚类算法确定K值及选取初始中心,进行网络安全数据的聚类分析,其次以随机森林算法预处理聚类数据,消除不相关特征的数据,再次领域粗糙集算法提取数据特征,建立极端梯度提升(eXtreme Gradient Boosting,XGBoost)分类模型。结果表明,文章方法在数据分类时有较高的召回率和查准率,且所需时间较短。

  • 单位
    武汉信息传播职业技术学院