摘要

为解决小样本条件下运用大数据驱动模型预测装备维修器材需求效果不理想的问题,提出一种新的数据模拟扩充算法。通过将不同时间段的器材累积消耗值作为相似度量改进了AP聚类算法,并对数据进行迭代聚类。结合改进后聚类算法的特点,将聚类为同一类别数据的各报告期器材相对消耗值考虑为正态分布数据,进而确定待预测数据各分量的正态分布数字特征。运用数学软件生成大量随机模拟样本构建训练集并进行预测。数值算例结果表明,通过本文方法生成的模拟样本可有效提升大数据驱动预测模型用于小样本器材需求预测的效果。随着模拟样本数据数量的增多,不同预测模型的预测结果稳定于同一预测值附近,有效提高大数据驱动模型预测结果的可信性。

  • 单位
    中国人民解放军装甲兵工程学院; 山西大同大学