摘要

实测数据的完整性和可靠性是工业大数据时代推动各行业发展的必要前提和关键因素。盾构机作为隧道掘进施工的关键设备,具有系统结构复杂,部分属性关联度高等特点,是“一带一路”等国家战略中城市地下建设的国之重器。然而,在盾构机作业过程中,由于环境干扰、采集中断、设备故障等诸多原因,数据缺失已成为盾构机实测数据采集中不可避免地问题,严重降低数据的质量与可信度,影响工程进度。针对盾构机实测数据的特点,提出一种基于模糊聚类和非线性回归的高精度缺失值填补算法。该方法首先通过模糊聚类的方法,将不同工况运行实测数据进行有效划分,获取多个线性子集。然后,为每个子集建立线性回归模型,采用交替迭代策略来求解模型参数,有效挖掘了属性间的关联关系。试验结果表明,所提方法无论是在对不完整数据聚类,还是对缺失数据填补,都具有良好的表现。提出的数据填补算法可有效解决数据划分和恢复问题,为盾构机实测大数据挖掘提供了可靠的基础。