摘要
针对电网故障诊断数据的类别分布不平衡,即故障类别相对正常类别比值小问题,提出一种基于Trees)的电网故障诊断方法。在采样阶段根据故障类样本的内部分布密度自适应计算合成新样本数量;在合成新样本时,计算离散型数据样本点之间的高维空间距离,使点之间的合成数量与距离成负相关关系,进行合成新样本;在基分类器生成过程中,节点分裂时随机选择特征,巧妙借助极端随机树随机性强方差低的特性解决了噪声数据的影响。实验结果对比传统分类和常用不平衡分类表明,该算法有效地提升了故障类的精度,同时克服了以往别的算法随机过采样导致的正常类精度下降,G-mean值达到82.6%,具有优越的电网故障诊断预测性能。
-
单位武汉大学; 郑州电力高等专科学校