摘要
近红外光谱分析中多变量校准模型的建立依赖于校准建模的光谱样本。然而,近红外光谱测量环境的变化会导致同一被测物的光谱样本的偏移。为了削减光谱偏移后重新建立校准模型的成本,提出一种基于深度自编码器(DAE)的非线性光谱转移方法,以端到端的形式实现不同测量环境之间的光谱转移,避免已有的线性光谱转移方法在非线性偏移光谱时效果不佳的情况。该方法在操作前不需要对光谱进行预处理和特征提取等操作,可以实现原始光谱之间的转移,是首个端到端的非线性光谱转移方法。为了实现光谱空间的有效转移,设计了一种基于条件概率和参数最大似然法的误差函数惩罚项,结合梯度反向传播算法优化深度自编码的网络参数。为了验证该方法的有效性,引入两个公共的近红外光谱数据集,分别是药片数据集和玉米数据集。利用本方法进行光谱转移的过程主要有:根据Kennard-Stone(KS)算法分别将两个数据集划分为校准集、验证集和测试集;用校准集中的光谱样本输入深度自编码器,根据设计的误差函数求出误差,并用反向传播法迭代训练网络参数,直至模型最优;将预测集样本输入训练好的DAE转移模型,可以发现转移后的光谱与相应的目标光谱谱线基本重合,这说明该设计的转移模型的有效性。最后,为了进一步验证本方法的优越性,将该方法与经典的线性转移算法光谱空间变换(SST)和分段直接标准化(PDS)进行比较。这三种算法得到的转移光谱分别作为测试样本,输入已建立的偏最小二乘(PLS)多变量校准模型,通过比较预测均方根误差(RMSEP),可以发现该方法在多变量校准模型中的预测结果的均方根误差均小于SST和PDS,分别提高了5.7%和10.1%,表明由非线性深度自编码器转移的光谱样本具有高效和实用的特点。
- 单位