摘要

入侵检测数据集一般有较多的特征,这些特征有些是冗余和不相关的,分类器在使用这些特征进行分类时容易发生过拟合,正确率低以及运行时间较长效率低的问题。为了避免这些问题以及减少数据的存储空间,利用混沌函数取代随机数改进了Jaya优化算法对入侵检测数据集KDD CUP99(data mining and knowledge discovery cup99)进行特征选择。以k-nearest neighbor(KNN)算法作为分类器,使用5折交叉验证在仿真环境下对提出算法进行测试,测试结果表明,提出算法比Jaya算法选择出更少的特征,具有更高的分类正确率,并通过两种算法的收敛曲线对比发现,提出算法具有更快的收敛速度。

  • 单位
    中国移动通信集团广西有限公司