摘要
由于忽略了时间序列的固有特性,常用于水电遥测量数据对象的数据清洗框架方法适用性不足。针对于此,设计了一套融合时间序列特性的水电遥测数据清洗改进框架,包括利用基于优化距离度量方法的DBSCAN算法提升异常值检测精度,将随机森林预测与时间序列分析结合进行缺失值填充,利用卡尔曼滤波算法降低数据随机扰动性,进而得到干净可靠的数据集。以某电厂某机组下导油槽油位数据作为样例数据,验证了方法的稳定性与可靠性。
- 单位
由于忽略了时间序列的固有特性,常用于水电遥测量数据对象的数据清洗框架方法适用性不足。针对于此,设计了一套融合时间序列特性的水电遥测数据清洗改进框架,包括利用基于优化距离度量方法的DBSCAN算法提升异常值检测精度,将随机森林预测与时间序列分析结合进行缺失值填充,利用卡尔曼滤波算法降低数据随机扰动性,进而得到干净可靠的数据集。以某电厂某机组下导油槽油位数据作为样例数据,验证了方法的稳定性与可靠性。