摘要
为高效、快速地处理配电网呈指数增长的数据,提高数据分析、决策能力,文中提出了1种基于大数据分析的配电网辅助决策系统设计。文中根据配电网业务需求特点,分别就流处理与批处理两种数据处理方式进行了分析。利用分布式计算通用框架MapReduce分别进行基于Strom的VFDT算法的构建,实现了流处理。同时利用Spark进行了随机森林算法的构建,实现了批处理。测试结果表明,基于Strom的VFDT算法可有效将数据进行分类,具有更好的分类准确率。此外,基于Spark的随机森林算法具有良好的可扩展性。
- 单位