摘要
提出数据缺失值插补算法和数据离群点检测算法。对管道全生命周期中产生的数据进行初步的筛选,然后进行管道全生命周期数据的预处理,检测缺失值和异常值。在数据缺失值插补算法中提出多元线性回归插补法,对检测的缺失值进行合理化插补。对管道数据中的离群点利用基于密度的局部离群点检测算法,将检测出的离群点进行仿真测试,局部离群因子(Local Outlier Factor, LOF)离群点检测算法正检率达96%,比传统的k-means离群点检测算法高41.18%,得到较高的检测精度,并建立最优检测模型。
-
单位中海油能源发展装备技术有限公司; 东北大学