摘要
随着电力系统智能化水平的不断提高,电网中产生的数据体系也越来越庞大,而数据的质量会直接影响电力系统的运行分析和规划决策。文中基于数据挖掘技术提出一种电网时序数据质量维护体系,筛选不合格的数据,并确定数据所存在的问题,为分析出现问题的原因提供便利。对电力数据及传输过程进行了分析,并指出了可能存在的问题。不同地区的数据具有自身不同的特点,为了提高检测速度,基于决策树算法先对历史数据样本进行决策分析。以某地区的数据训练集为例,对该地区电力数据检测流程进行分析,得到适合该区的检测顺序。针对数据合理性难以检测的问题,利用基于聚类的离群检测法筛选出问题数据,并尝试分析问题数据产生原因。通过算例证明了所提时序数据质量维护流程的有效性和可靠性。
- 单位