摘要
微服务正逐渐成为大规模云应用的主流设计架构,微服务的可靠性是云服务商必须处理的关键问题。如何精确有效地检测并定位微服务应用的故障是保障应用可靠性及稳定性的重要技术。基于微服务调用链的异常检测技术可以在系统发生故障时及时地发现系统异常行为并触发告警。针对当前主流方法不能保证异常告警实时性和准确性的问题,提出一种基于自然语言处理和双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,BiLSTM)的微服务调用链异常检测方法MicroTrace。首先对调用链中记录的事件进行解析,将事件表示为语义序列及响应时间序列,然后利用词汇嵌入式表示算法提取出事件的向量化表示,利用基于注意力机制的BiLSTM同时检测微服务实例的调用路径异常以及性能异常,最后在某大型运营商提供的真实微服务调用链数据集上进行了验证,实验结果表明,本方法在查准率和查全率等方面均可达到96%以上,检测精度相对于当前主流方法有至少6.8%的提升。
-
单位国家电网有限公司; 南京航空航天大学