摘要
本发明属于系统日志分析技术领域,公开了一种基于关联分析和时间窗的日志模板快速提取方法及系统,日志层次关系抽取:对具有关联性的系统日志提取多种子类型,所述子类型作为这一类事件的所有日志模型;构造模板树:经处理过后的有相同的字段日志作为树结构中父节点。本发明利用Rand_index方法分别对手动聚类结果和三种模板抽取方法提取数据集模板,分别比较其相似性;在对比的三种模板抽取方法中,对数据集模板提取效率最低的是在线模板抽取模型,正确率在50%左右,效率最高的是基于关联关系的模板抽取模型,正确率在90%左右,因此本发明提出的基于关联关系的模板抽取模型更为可靠。
- 单位