煤矿综采设备运行状态大数据清洗建模

作者:马宏伟; 吴少杰; 曹现刚; 徐博远; 张鑫媛
来源:工矿自动化, 2018, 44(11): 80-83.
DOI:10.13272/j.issn.1671-251x.2018040090

摘要

针对煤矿综采设备运行状态数据量大、数据存在噪声和缺失值等问题,建立了一种基于MapReduce的煤矿综采设备运行状态大数据清洗模型。该模型采用双MapReduce协同工作:通过第1个MapReduce对数据中的噪声点和缺失值进行修正,输出多个清洗后的数据文件;通过第2个MapReduce对多个清洗后的数据文件按采集时间及日期进行排序,并合并成单个数据文件输出。实验结果表明,该模型能有效剔除噪声数据和补全缺失数据,具有较好的数据清洗效果。

全文