摘要

为提升运维人员响应速度,降低云环境异常对云上应用的影响,研究了一种基于长短期记忆(LSTM,Long Short-Term Memory)的云环境异常智能检测方法。通过将传统时间序列分析算法同LSTM神经网络相结合,实现在线预测云环境监控数据,并通过正态分布和贝叶斯推理定义预测波动范围,快速准确地判别云环境异常。在铁路云数据中心环境中进行测试验证,同其他时序预测方法的比较证明,本方法具有判别准确性高、对各种场景适用性强的优点,可为铁路大规模云数据中心智能运维实施提供一种有效的异常检测手段。