传统的电站设备故障诊断方法,一般是依据故障表征和报警信息,结合以往的经验进行分析。由于经验的获取比较困难,诊断的准确程度又依赖于经验的丰富程度和知识水平的高低,当参数及规则较多时,推理过程中存在匹配冲突、组合爆炸等问题,使得推理速度较慢、效率低下,不可避免地使得诊断结果存在不确定性。采用数据驱动的方法,充分挖掘有限数据可利用的信息,可以优化并加快故障诊断的进程。分别以多元统计分析、信号处理、机器学习三种数据驱动的方法,结合数据可视化,对电站设备故障进行了定量分析和研究。