摘要
随着智能化设备的日益更新和计算机储存数据能力的提升,制造业企业在其产品制造过程中产生了大量的流水线数据,如何充分利用这些数据一直是工业界的一个难题.本文根据制造业企业的真实大规模生产数据,通过对其进行细致的探索性数据分析,建立了一种基于FTRL和XGBoost算法的二分类产品故障预测模型,并根据适用于非平衡数据集的MCC (Matthews Correlation Coefficient)评价指标采用交叉验证方法对其进行优化.实验结果表明,该模型对于大规模(不仅样本量大,特征量也很大)正负样本非平衡的生产流水线数据集具有运行效率高,故障预测精度高的效果.基于此模型我们可以构建更智能的产品故障检测系统,有效降低企业运营成本的同时也带来了可观的利润增长.
- 单位