摘要

为解决营销业务人员填报流程信息错误、快速查出营销系统客户档案不准确信息,减少人为原因填报不准确造成的电价执行错误及电费纠纷问题,提升客户档案数据的可用性,基于营销系统、用电采集系统档案数据,对数据清理、集成、规约、离散化完成数据清洗和规范化转换,形成电力客户档案数据字段宽表,并以数据结构、关联规则、主从关系为主线,梳理不同字段的单相关、偏相关、复相关关系和数据特性,探索字段之间的关联关系。通过AdaBoost分类器、Knuth-Morris-Pratt算法、IF-THEN规则、Sunday算法等多种大数据技术,对整理的数据进行分析、统计并构建完整的数据应用模型,形成业务规则模型及数据特性分析模型,实现自动统计分析异常历史数据可视化展示,提升档案异动数据整改效率;业务智能分析模型实现营销业务流程输入字段自动输出相关联字段信息,提高填报准确率。