摘要
入侵检测(ID)是保障网络安全的有效手段之一,为了提高入侵检测系统的检测率,降低误报率,越来越多机器学习算法被应用到了其中。随机森林算法以其对高维度数据的良好表现和较强泛化能力进入了研究人员的视线。然而随机森林算法的时间复杂度通常很高,且对取值划分较多的特征有偏向,因此文中基于以上两点提出了一种改进的随机森林算法,利用K-means算法对训练集中不同类别的数据聚类,使用每一簇的样本中心代替该簇的所有样本,实现较快的建模速度。在单个决策树的建立过程中使用One-R算法快速评价各属性,加快了决策树的建立,在划分类别时采用分层式划分,增加了检测率。在NSL-KDD数据集上的实验表明,该改进算法较传统随机森林算法在各个网络攻击模式上的检测率均有所提高,其中对U2R攻击和R2L攻击的检测率提高了4%。另外,不管是建模速度还是分类速度都有较大的提升。
-
单位武汉邮电科学研究院; 烽火通信科技股份有限公司