摘要
针对当前烟叶质量分析过程中容易出现信息损失的问题,提出一种基于XGBoost算法和成分特征的烟叶质量分级预测方法。采集烟叶样品的近红外光谱数据并应用红外定量分析原理,提取烟叶成分特征,利用随机森林算法计算每种成分特征的重要性,并筛选出有意义的特征项;同时引入正则项的极限梯度提升算法构建烟叶等级预测模型,处理大规模的烟叶质量特征数据;再结合当前烟叶质量分级标准,得出最终的烟叶质量分级预测结果。结果表明:该方法预测结果的AUC值为0.9,极大地提升了烟叶质量分级预测结果的准确性。
-
单位湖北中烟工业有限责任公司