摘要
随着企业信息化建设的深入,数据质量问题逐渐成为困扰企业管理人员的重要问题。企业管理信息系统的推广实施,使得传统系统运行过程中的数据迁移、数据转换、协同交互等产生大量问题数据,导致现有的数据质量管理平台在功能及性能上遇到了瓶颈。为了及时、准确地支撑业务部门进行数据质量探查、分析、治理,主要介绍了带查询的分布式系统基础架构(HAWQ)数据平台在电力企业数据处理中的应用情况,以及数据质量及实用化管理平台设计方案。根据试验结果可知,对比传统系统,基于HAWQ数据质量管理的效率有显著的提升。其中,对多表关联的数据一致性校验效率提升高达40倍。该研究对海量数据数据质量的管理具有现实意义和指导价值。
-
单位广东电网有限责任公司