摘要
针对国标化学检测方法耗时耗力、成本昂贵的问题,分析了近红外光谱(NIRS)结合化学计量学进行大米蛋白质含量检测的可行性。基于变量选择、特征提取和非线性建模的策略,将反向区间偏最小二乘(BiPLS)与主成分分析(PCA)和支持向量机(SVM)相结合,构建了BiPLS-PCA-SVM模型,用于提高蛋白质回归模型的性能。在BiPLS-PCA-SVM模型中,将蒙特卡罗交叉验证与预测残差平方和相结合进行最佳主成分个数的选择,通过遗传模拟退火算法对模型参数进行优化。为了评估BiPLS-PCA-SVM模型的性能,建立了Full-PLS、BiPLS和BiPLS-SVM 3种模型,并系统分析了上述模型的预测精度和鲁棒性。BiPLS-PCA-SVM模型在预测蛋白质含量方面显示的性能高于其他模型,使用最佳主成分和优化后的SVM参数建立的模型具有更高的鲁棒性和准确性。对于BiPLS-PCA-SVM模型,验证集的决定系数、均方根误差和剩余预测偏差分别为0.928 9、0.196 7%和4.024 6。结果表明,NIRS与BIPLS-PCA-SVM模型相结合,可作为替代策略实现大米中蛋白质含量的快速检测。
- 单位