摘要
利用近红外光谱分析方法预测了玉米秸秆纤维素的含量。针对近红外光谱的高维高相关性的特点,探讨在对玉米秸秆纤维素建立偏最小二乘(PLS)预测模型时的特征波长筛选问题。首先探讨了联合区间偏最小二乘法(SIPLS)和后向区间偏最小二乘法(BIPLS)的区间划分数对算法效果的影响。在SIPLS和BIPLS的基础上,利用遗传模拟退火算法(GSAA)进行二次特征波长筛选,进一步提高模型的预测精度和建模效率。结果表明:相对于PLS方法,3种算法单独使用均能够提高所建模型的预测精度,但是SIPLS、BIPLS两种算法的效果在很大程度上受区间划分数的影响。BIPLS模型的预测集均方根误差(RMSEP)虽然最小,但选择的变量数多达485个,影响模型的建模效率。在SIPLS和BIPLS的基础上,利用GSAA进行二次特征波长筛选,相较于BIPLS, BIPLS-GSAA模型的RMSEP虽略增大,但其输入变量减小到134个,而建模的主成分数也由11降为10个。相较于SIPLS, SIPLS-GSAA模型的输入变量仅为34个,预测精度得到了提升,实验结果表明,SIPLS-GSAA模型的预测效果最好。基于SIPLS和BIPLS上的GSAA对光谱数据进行二次筛选不仅能简化模型的输入,而且能有效提升模型的预测能力。
- 单位