摘要

提出了一种基于时间戳和关键字的聚类算法来解决告警数据种类繁多且难以提取关键信息的问题。首先,对告警数据中的最新发生时间进行K-Means聚类;其次,基于告警数据开始时间进行K-Means二次聚类;再次,使用具有噪声的基于密度的聚类算法(Density-Based Spatial Clustering of Application with Noise,DBSCAN)对每列关键字进行聚类;最后,对结果进行了整合,并给出了关联性描述结果。实验结果表明,通过上述聚类算法构建的告警数据分析与处理模型的平均压缩率为79.28%,平均准确率达到93.41%,能够有效提高对现有告警数据的具象化描述能力,降低告警数据理解的复杂度。

  • 单位
    中国电子科技集团公司第三十研究所