摘要

为解决大型分布式系统中服务故障排查困难及系统恢复漫长的问题,需要实现分布式服务故障分析技术。针对分布式服务故障定位复杂并需要快速定位故障的需求,文章提出一种基于孤立森林算法的分布式服务故障分析模型。通过滑动平均算法对主机性能数据进行时序计算生成动态阈值区间,并利用孤立森林算法进行模型训练,从而实现对分布式系统服务进行故障定位与分析。该方法可有效提升运维人员的工作效率并减轻运维人员的工作负担,同时协助运维人员快速排查故障问题,达到对分布式服务故障快速定位快速处理的效果。

  • 单位
    中国联合网络通信有限公司