基于XGBoost算法的山东烟叶质量预测模型初探

作者:别瑞; 周婷云; 周显升; 姜滨; 周永; 邱军; 曹建敏*
来源:中国烟草科学, 2022, 43(05): 80-93.
DOI:10.13496/j.issn.1007-5119.2022.05.013

摘要

为挖掘烟叶化学成分与感官质量之间的关系,探究机器学习算法在烟叶质量评价领域的应用效果,以山东烟叶为试验材料,开展了常规成分、生物碱、有机酸、多酚和单双糖等20项主要化学成分检测和感官质量评价,并根据感官质量优劣将其划分为好、中、差3个质量档次。利用遗传算法对XGBoost进行超参数寻优,建立了基于化学成分的山东烟叶质量档次预测模型,同时引入SHAP value模型解释框架进行全局解释与特征依赖分析。所建预测模型对山东烟叶质量档次判别准确率为85%,尤其对第3质量档次识别效果最佳。SHAP value全局解释表明,影响山东烤烟质量的7个特征指标贡献度排名为:酸酚比>蔗糖>氯>烟碱>降烟碱>柠檬酸>糖碱比,其中糖碱比、蔗糖、酸酚比分别为好、中、差质量档次判别贡献最大的化学指标。基于XGBoost算法的山东烟叶质量预测模型在烟叶质量档次判别应用中有效、可靠、可解释性强,对于烟叶质量评价和烟叶生产具有一定指导意义。

  • 单位
    中国农业科学院研究生院; 中国农业科学院烟草研究所; 中国烟草总公司山东省公司; 山东中烟工业有限责任公司; 山东日照烟草有限公司

全文