摘要

日常运维中存在常见的异常行为,如访问延迟增大、网络设备故障、配置错误、缺陷版本上线等,这些异常行为往往会带来监控数据的高维度、高噪声、大规模数据流等问题,使得传统异常检测方法对现阶段大型运维系统中存在的异常行为难以实施有效监控。为降低系统误检率和节约人力维护成本,本文提出了一种新型基于粗糙集分类器的关键性能指标(Key Performance Indicator,KPI)异常检测方法,该方法通过一种有监督的方式,构建粗糙集分类器,从而实现对运维系统的异常检测。值得一提的是,由于该异常检测模型是基于粗糙集理论,使得该模型的建立不需要任何人工参数的设定,降低了人为干扰,从而保证了建立的分类模型的可靠性。实验部分,通过UCI公开数据集验证了算法的有效性。

  • 单位
    中国人寿保险股份有限公司