摘要
目的建立基于优化的随机森林算法模型实现对食品不合格指标的分类预测。方法通过收集山东省食品药品监督管理局2015—2019年食品安全抽样检验产生的不合格数据,并对其进行多项数据预处理操作,采用超参数网格搜索和10折交叉验证方法建立基于随机森林的食品不合格指标的分类预测模型,并通过对传统随机森林模型的参数优化,将其与决策树(decision tree, DT)、逻辑回归(logistic regression, LR)和梯度提升决策树(gradient boosting decision tree, GBDT)算法分类预测结果进行对比。结果实验表明经过参数优化后的随机森林模型对食品中不合格指标的预测准确率能够达到89.4%,比DT算法提高了11.0%,比LR算法提高了9.0%,比GBDT算法提高了8.1%。结论基于优化的随机森林模型可以完成食品不合格指标分类预测任务,有广阔的应用前景。
- 单位