摘要

为实现高效的近红外光谱非线性回归分析,提出了一种基于改进堆叠自编码器结合LightGBM的近红外光谱回归分析算法。该算法由堆叠自编码器模块与LightGBM模块构成,将堆叠自编码模块得到的隐层特征输入LightGBM模块进行回归分析,通过递进式策略自适应确定堆叠自编码器模块的结构,并利用Optuna框架自动优化LightGBM模块的超参数。为验证方法的有效性,以烟草的还原糖、氯、钾、总氮4种成分为研究对象,利用1 911个烟草样本进行建模,并与其他4种近红外光谱回归分析算法进行了对比。经实验验证,烟草还原糖、氯、钾、总氮预测模型的平均RP、RMSEP、RP2分别为0.911 0、0.056 8、0.832 8,预测精度在5种方法中综合最优。在训练集表现相当的前提下,所建方法的预测集精度相较于XGBoost提高1%~40%,过拟合问题得到改善。改进的堆叠自编码器结合LightGBM算法应用于近红外光谱分析表现出良好的成分回归分析能力,可用于烟叶化学成分预测模型的构建。

全文