摘要
现有事故预警模型多依赖大量数据训练,而许多中小企业的安全生产数据积累不足。为了利用少量样本数据训练出相对精确的事故集成预警模型,首先,运用合成少数类过采样(SMOTE)算法对小样本数据进行预处理;其次,基于相关数据训练单个机器学习算法,选择最优机器算法作为集成方法的基分类器;同时,利用特征重要性优化企业事故预警指标;最后,通过投票法、装袋法、提升法、堆叠法4种集成方法进行拟合,提高企业事故预警模型精度。结果表明:SMOTE方法能较好地模拟出企业事故预警数值,增加其数据量,较好地解决了小样本数据不平衡问题。此外,在基于4种集成方法的企业事故预警模型的比较中,发现基于装袋法的企业事故集成预警模型拟合效果最佳,测试精度可达到88.46%。
- 单位