针对电网边缘终端用电时序数据重复问题,提出一种数据自动去重系统。基于分布式文件系统,采用客户端、元数据服务器、数据服务器以及网络通信模块等组件,构建电网边缘终端用电时序数据自动去重系统及其工作流程。通过对比分析部分去重、全局去重以及综合去重的单位时间重复数据去除量,选取综合去重法作为系统去重策略。针对用户连续两年的用电时序数据集展开系统仿真,采用空间压缩率、去重率以及吞吐量三个指标全面评估去重质量,结果验证所建系统具有较好的去重质量,吞吐量优越性较为显著。