基于核系数样本选择算法的光谱模型更新

作者:贺忠海*; 曹功伟; 贾琼; 张晓芳
来源:分析测试学报, 2023, 42(12): 1652-1658.
DOI:10.19969/j.fxcsxb.23070901

摘要

近红外光谱建立的偏最小二乘(PLS)模型的预测能力通常因待测样品的组分或环境条件发生变化,不能很好地预测新样本。该情况下需把新标记样本加入标定集合进行模型更新。但由于旧标定集合中的样本数量大,少量新样本的加入在模型中难以体现。为快速更新模型,该文提出了一种利用核系数选择重要旧样本(Kernel Coefficient Selection,KCS)以减少样本数量的方法,即对旧样本建立核模型,计算各样本在模型中的系数,选择在系数大的样本中加入新样本更新模型。以模拟和豆粕数据集进行实验,对KCS选择部分旧样本加入新样本的模型和全部旧样本加入新样本的模型进行对比。结果显示,KCS选择部分旧样本用于模型更新后,其预测均方根误差分别从更新前的1.165、0.730下降至更新后的0.961、0.654,分别下降了17.5%和10.4%;全部旧样本用于模型更新后,其预测均方根误差分别从更新前的1.110、0.720下降0.980、0.662,分别下降了11.7%和8.1%。实验结果表明,这种挑选部分重要旧样本用于模型更新的方法解决了新旧样本数量失衡的问题,提高了模型的更新速度。

全文