摘要

为解决大型分布式系统中服务故障排查困难及系统恢复漫长的问题,需要实现分布式服务故障预测技术,而当前基于人工技术难以实现该需求。为实现该需求,文中提出一种基于XGBoost算法的分布式服务故障预测模型。通过对主机性能数据进行巧妙转换,将预测问题转换为分类问题,并利用XGBoost算法进行模型训练,从而对分布式系统服务进行故障预测。根据该方法,可有效提升运维人员的工作效率并减轻运维人员的工作负担,同时协助运维人员快速排查故障问题,起到对分布式服务故障早发现、早治理的效果。

  • 单位
    中国联合网络通信有限公司