摘要

当数据集发生非法入侵时,原数据属性会遭到破坏,且由于数据本身的不确定性及噪声等问题,入侵数据点位置的挖掘难度较大。为此,提出基于并行频繁模式增长算法(Frequent Pattern Growth, FP-Growth)的数据点位置智能挖掘方法。建立信息熵-主成分分析法融合算法(Entropy-Principle Compoent Analysis, E-PCA),对大数据降维。融合入侵检测和K均值聚类算法(Intrusion Detection Systems K-means clustering algorithm, IDS K-means算法)和并行FP-Growth算法,实现入侵数据的检测。利用邻居节点数据投票的方式实现入侵数据点位置智能挖掘。实验表明,所提方法检测入侵数据时误报率低于1.0%,数据点位置挖掘准确率高于98%,且能够精准实现正常数据与异常数据的聚类。以上结果均证明了所提方法具有更优的应用性能。