多源数据融合智能识别煤矿山场景特征AI模型

作者:王立兵; 任予鑫; 马昆; 王蕾; 刘峰; 翟文; 董霁红*
来源:煤炭学报, 2023, 48(12): 4617-4631.
DOI:10.13225/j.cnki.jccs.2023.0805

摘要

矿山场景数据是智慧矿山建设和智能管理的基础数据,如何利用包括遥感影像在内的多源数据快速识别和提取出复杂的矿山场景是重要的研究方向。采用2020年Sentinel-2影像、GF-6影像、GF-2影像进行最优数据集筛选,使用2023年谷歌影像(Google image)数据扩充数据集,并与深度学习算法相结合,建立了2种露天煤矿场地识别模型。研究主要结论:(1)利用10 m Sentinel-2影像、8 m GF-6原始影像、2 m GF-6融合影像、3.2 m GF-2原始影像、0.8 m GF-2融合影像建立矿山识别模型,量化选择不同数据产生的模型精度。结果显示,遥感图像空间分辨率从10 m增加到0.8 m,通过相同的方法建立的矿山场景识别模型的精度逐渐提高。其中使用0.8 m空间分辨率的GF-2融合影像建立的矿山场景识别模型的精度最高,平均精准度PA和(MIOU,Mean Intersection over Union)分别达到了0.702和0.824。(2)从多源遥感图像中采集了3 162个多场景、多时段、多尺度矿山场景样本对所有样本进行统一融合处理,建立了矿山场地场景识别模型(MSSRM, Mine Site Scene Recognition Model)和矿山场地边界识别模型(MSBRM, Mine Site Boundary Recognition Model)。MSSRM的PA达到了0.758,MSBRM平均交并比达到0.864。(3)对比了Faster R-CNN(FasterRegion-basedConvolutionalNeuralNetwork)、 YOLO-v5(YouOnlyLookOnce-v5)、DETR(Detection Transformer)3种目标识别方法与Mask R-CNN、U-Net、DeepLabV3+三种图像分割方法建立的煤矿场地识别模型精度,其中,DETR方法建立的识别模型与Faster R-CNN和YOLO-v5相比PA分别提高了7.6%和8.3%。DeepLabV3+建立的分割模型与Mask R-CNN和U-Net相比MIOU分别提高了14%和10.8%。(4)建立了从大范围的遥感影像中自动化、智能化、批量化识别矿山场地场景并绘制矿山场地边界的方法,以干旱、半干旱典型矿区(鄂尔多斯)露天煤矿场地识别应用为例,验证了智能识别矿山场景边界方法的性能,模型制图精度达到了0.817。

全文