为了提高数据质量,针对水电机组的监测数据中含有高比例的异常错误,从错误数据辨识和缺失数据恢复两方面进行了研究。针对错误数据辨识问题,结合数据中具有的延时性和相似性等特征利用K-means聚类方法辨识出异常数据;针对数据缺失等问题,则根据数据中具有的小样本、非线性等特点,利用支持向量回归恢复缺失数据;构建了基于K-means聚类和支持向量回归的错误辨识和缺失恢复的数据处理方法。最后利用实际的监测参数验证了此方法的有效性。