摘要

本发明公开了一种基于日志数据的云系统故障诊断方法。所述方法包括以下步骤:对输入的日志数据进行预处理,提取日志模板、时间戳和指纹集;对预处理后的数据进行缓存,并对缓存内的数据按时间戳进行排序和提取额外指纹集;将离散的日志按任务划分形成工作流;生成带有任务标记的参照,通过生成的工作流与参照的相似性确定工作流所属的任务类别;基于自动机模型,为每个任务构建诊断自动机;计算训练数据集中每个日志模板的词频-逆文件频率值得到词频-逆文件频率字典;使用词频-逆文件频率字典对实时日志数据进行过滤,通过诊断自动机匹配过滤后的日志序列完成故障的诊断和定位。