摘要

矿井智能通风系统对矿山智能化建设至关重要。为解决矿井通风参数在实际测量时,因为巷道不具备测试条件、仪器信号受到干扰、巷道断面风速不均一、人工操作不当等制约性因素,造成的矿井通风参数数据缺失问题,提出了1种基于随机森林-链式方程多重插补法的矿井通风参数缺失数据填补方法。采用链式方程多重插补法,通过迭代对每个缺失的属性值产生n个填补值,从而产生n个完整数据集,对n个完整数据集进行分析优化得到1个最终的完整数据集。为了提高缺失值填补精度,合理考虑了矿井通风参数缺失数据的不确定性对分析过程的影响,在随机森林的预测任务中,结合预测均值匹配模型对缺失数据进行填补。以潞新二矿为实验对象,利用智能矿井通风仿真系统IMVS对潞新二矿矿井通风参数原始数据集进行数据预处理,得到完整、准确的矿井通风参数完整数据集,对完整数据集分别进行了不同缺失属性、不同数据缺失率、不同迭代次数的对比试验。以多种模型评价指标对模型有效性进行评估。结果表明:基于随机森林的链式方程多重插补模型填补形成的完整数据集与原始数据集具有很好的相似性;对不同缺失列进行填补实验的结果显示填补模型可以轻松处理混合类型的数据,自主学习参数之间的相关性从而降低了填补复杂性;迭代后形成的n个数据集通过分析合并成一个最终数据集,提高了填补准确率;对初始填补后的完整数据集进行不同迭代次数的实验发现,迭代超过一定次数后,数据相关性一定会收敛。

全文