摘要

针对傅里叶变换红外光谱仪获取的谱线数量庞大,直接选用全部谱线进行多元线性回归易导致过拟合、稳定性差、分析周期长等问题,提出了一种基于频率与回归系数相结合的自举柔性收缩变量选择方法。该算法以变量的权重作为选择的依据,在每次迭代过程中,根据变量的回归系数与频率计算变量的权重,通过加权自举采样技术实现对变量的柔性收缩。应用玉米红外光谱集对该方法进行了验证,在玉米油数据集中,其预测均方根误差(RMSEP)与相关系数(Rp)分别为0.020 2和0.976 5,变量数目由原始的700个减少到13个;在玉米蛋白质数据集中,RMSEP与Rp分别为0.027 9和0.996 8,变量数目由原始的700个减少到16个。结果表明,提出的变量选择算法选择的变量少而精,具有实际的应用价值。

全文