摘要

控制集群系统的复杂性和多样性导致集群系统易发生故障,从而降低集群系统的可用性。针对现有的故障检测方法存在的检测效率和准确度较低、故障类型难以有效自动识别等问题,本文提出一种基于改进的自适应算术优化的多类支持向量机(Arithmetic Optimization Algorithm-Multi-class SVM,AOA-MSVM)的控制集群故障检测方法来检测集群中的故障,以提高集群系统的可用性。首先,运用局部线性嵌入算法对集群系统中监测到的系统信息进行降维;然后,针对集群系统中故障种类多的特点,运用一对多支持向量机的方法构建故障检测模型,提升检测故障的能力;最后,使用改进的自适应算术优化算法对模型参数求最优解。搭建高可用控制集群系统进行对比实验,实验结果表明,本文提出的故障检测方法具有更高的检测效率和准确度并可有效识别故障类型。