摘要
本发明公开了一种多源日志的在线解析方法、系统、电子设备及存储介质,方法包括:收集多源日志;利用日志树对收集的日志进行归类和提取日志关键字段信息;对关键字段信息message字段进行预处理;对经过预处理的日志message字段,利用首个单词对日志进行分组;对分组后的日志message字段内容进行动词词性特征提取;将同类动词词性特征的日志通过最长公共子序列LCS算法提取日志事件模板和更新日志模板。该方法通过日志动词词性特征区分出执行类日志和状态类日志,并结合日志的多源信息,能为后续的日志分析中构建工作流图和根因分析提供重要的数据基础,有效解决日志字符结构类似而语义不同的日志被误判为相同日志事件的过拟合问题。
- 单位