摘要

为了解决在对织机设备进行数据采集时出现异常数据导致数据质量低下、可用率低的问题,提出一种基于概率分布和XGBoost决策算法的织机异常数据处理方法。首先,对织机各参数相邻数据点的时序变化差值进行获取,得到反映各参数近似变化趋势的可信区间。其次,基于织机参数间的相关性程度,利用贝叶斯网络对织机正常数据点、偏离异常点和不活跃异常点3类数据类型的概率分布进行推理,定位异常数据发生的时刻点和异常类型。再次,基于XGBoost决策算法对织机异常数据造成的数据缺失位进行修复。最后,以石家庄某纺织企业织机设备的采集数据为例进行分析,结果表明:与决策树和K最近邻算法相比,所提织机异常数据识别方法平均异常识别率分别提升了13.80%、19.09%;所提织机缺失数据修复模型能提升修复准确度,对织机织布产量、打纬次数、运行效率和运行车速的拟合系数分别为0.9646、0.9563、0.9832和0.9736。