摘要
因正常数据丰富、故障数据匮乏而引起的数据不平衡,已经成为工业大数据智能决策技术面临的关键问题之一。因此,针对机械设备故障诊断研究中经常遇到的不平衡数据集中少数样本类别识别精度偏低的问题,提出一种基于云模型的集成学习方法并将其用于旋转机械不平衡数据的模式识别。该方法首先将提取出的轴承故障特征数据集通过ReliefF算法计算各特征的权重,依据特征权重值降序排列的结果提取出权重趋大的特征构成低维特征集,并将低维特征集划分为不平衡训练集、测试集两部分;其次通过云模型理论中的正向云发生器、逆向云发生器对低维特征集中各个特征分别绘制云图,得到单一特征下各状态的训练数据与测试数据云图;然后通过距离公式判别与待测样本距离最近的训练数据云图,判断出单一特征下待测样本的类别;最后通过集成学习方法将各个特征下的识别结果进行整合,以相对多数投票法识别出待测样本的所属类别结果。与传统的BP神经网络、支持向量机两种分类器进行对比的试验表明,该方法不仅对不平衡数据的待测样本识别精度较高,而且具有一定的泛化性能。
-
单位机电工程学院; 兰州理工大学