基于关联规则的电网大数据质量校验方法研究

作者:孙小虎; 秦浩; 张亚平; 王超
来源:电子设计工程, 2020, 28(21): 145-153.
DOI:10.14022/j.issn1674-6236.2020.21.031

摘要

为解决基于传统数据库质量校验方法、基于独立服务器质量校验方法受到冗余数据干扰,导致大数据质量校验结果不理想的问题,提出了基于关联规则的电网大数据质量校验方法研究。分析基于关联规则电网不安全大数据诱因,在关联规则支持度、置信度和相关度支持下,计算不安全大数据诱发度,剔除冗余数据。采用增量式方法校验诱发因子,构建校验索引,遵照关联规则并行化处理诱发因子数量。将Oracle数据库中数据交付到集成服务器上,设置4条数据集成路径,通过Java消息服务应用程序接口,触发数据转换功能,借助网络浏览器生成大数据质量校验统计结果。由实验结果可知,该方法当月新增和当日新增数据校验结果更加贴近理想校验结果,对电网大数据合理设置提供较好的指导意义。