能源行业结构化数据质量评估研究

作者:徐琳; 张克铭; 郑钦; 路亚俊; 樊想
来源:河南科技, 2023, 42(23): 151-154.
DOI:10.19968/j.cnki.hnkj.1003-5168.2023.23.031

摘要

【目的】随着能源行业海量数据逐步接入区域能源数据中心,能源数据质量评估与修复工作日益重要。为解决海量能源行业数据中存在的结构化数据质量低、异常数据修复难度大的问题,开展能源行业结构化数据质量评估,对提高能源数据管理水平具有积极意义。【方法】通过Strong-Wang框架搭建能源行业结构化数据质量检查框架,实现能源行业结构化数据的质量规则类型和数据质量特性的标准化定义;通过构建元数据质量评估规则,实现能源行业结构化数据的多维度评估;通过戴明环方法“计划-执行-检查-处理”的全生命周期数据质量管理,实现能源行业结构化数据质量管理与异常数据修复。【结果】在某城市能源数据中心进行实际应用,电、水、气、热等类型的能源数据质量平均修复准确率达98.57%。【结论】该方法有效分析了能源行业结构化数据质量问题,实现了结构化数据质量的高效修复。

全文