摘要

分布式架构带来系统节点、微服务数量呈几何级数增加,告警量随之爆发,运维监控工作量急剧上升,传统的IT运维模式已经不能满足当下超大集群环境的要求。文章对智能运维(AIOps)告警模式展开研究,分析中国电信分布式架构下的IT运维告警模式现状及存在的问题,提出基于AI技术的创新技术方案,结合AIOps场景算法,实现告警智能归并,并在实践应用中验证了模型算法的可行性、准确性和有效性,展望未来运维的演进方向。

  • 单位
    中国电信股份有限公司