摘要

水电站多年运行积累了大量的故障记录文本,通过对故障记录挖掘可以实现故障快速诊断,为水电站设备检修与管理提供辅助决策。针对这一情况本文提出了基于文本挖掘技术的水电站故障诊断方法,根据故障现象描述快速诊断故障类型。首先研究大量水电站故障现象文本,将故障按照特性划分为不同故障类型,并对文本进行预处理将其转为文本矩阵。然后,将文本矩阵输入XGBoost分类器进行训练和参数调优,构建了基于XGBoost算法的水电站故障分类模型。最后,与决策树、支持向量机、朴素贝叶斯等传统分类模型进行实验对比,实验结果表明,XGBoost在分类的综合性能、泛化能力方面要优于对比的分类模型。实验结果证明本文所提方法在水电站故障诊断上有较好的效果,可以准确判断故障类型,为今后故障分类诊断挖掘奠定基础。