摘要

采用近红外光谱技术,对不同贮藏时间的蓝莓营养成分进行定量分析,以寻求其化学成分与近红外光谱数据的相关性,实现利用光谱技术对蓝莓营养成分的无损检测。对获取的近红外光谱数据,运用偏最小二乘回归(Partial Least Square Regression,PLSR)和支持向量回归(Support Vector Regression,SVR)两种机器学习算法预测蓝莓可溶性固形物(Soluble Solids Content,SSC)和维生素C(Vitamin C,VC)含量。为增加预测精度,采用一阶导数(First Derivative,1-DER)、二阶导数(Second Derivative,2-DER)、标准正态变换(Standard Normal Variate Transform,SNV)、多元散射校正(Multiplicative Scatter Correction,MSC)、Savitzky-Golay平滑(S-G)等一种或几种方法组合对光谱数据进行预处理,比较分析最佳的预处理方式;采用竞争适应性重加权采样法(Competitive Adaptive Reweighted Sampling,CARS)和随机蛙跳算法(Random Frog,RF)及两种算法组合对光谱波长进行降维处理。结果表明,降维后的SSC波长变量分别降到了全光谱变量的1.7%、4.3%和5.6%,VC波长变量分别降到了全光谱变量的2.5%、2.9%、4.8%。在筛选后的光谱波长变量的基础上,采用PLSR建立蓝莓近红外光谱与SSC和VC含量的预测模型。对比发现CARS结合RF算法筛选出的波长变量预测效果更好,模型校正相关系数分别为0.9001、0.8707,校正均方根误差分别为0.8234、2.9429,预测相关系数分别为0.8424、0.8350,预测均方根误差分别为0.9613、2.9482。为排除模型性能对预测结果的影响,建立SVR模型将预测结果进行对比,同样发现CARS结合RF算法的预测效果更佳,模型校正相关系数分别为0.8702、0.8503,校正均方根误差分别为0.9549、3.2431,预测相关系数分别为0.8269、0.8183,预测均方根误差分别为0.8769、2.8818。本研究为蓝莓营养品质监测提供了模型基础,且选择特征波长的方法可以为更多果蔬营养物质预测模型提供参考。