摘要
为提高近红外光谱数据建模后的预测精度和泛化能力,建立了基于三种降维特征提取的近红外光谱数据的回归模型。针对玉米(corn)近红外光谱数据集,首先选择标准正态变量变换(Standard Normal Variate transform,SNV)、一阶求导、Savitzky-Golay(SG)卷积平滑法进行单一和其组合方法的光谱预处理;然后分别利用局部线性嵌入(Locally Linear Embedding,LLE)、主成分分析(Principal Component Analysis, PCA)、等距映射(Isometric Mapping, Isomap)算法对高维光谱数据实现降维;最后结合支持向量机,使用网格搜索优化主要参数并交叉验证,分别实现了支持向量机回归(Support Vector Regression,SVR)建模。对比实验结果,不同的预处理组合方法影响着模型的预测精度和泛化能力,其中基于"SNV+PCA+SVR"构建的模型最优,相关系数r=0.9235,R2=0.8393,RMSE=0.2820。
- 单位