摘要
西红花不仅是在世界范围内广泛使用的传统香料,也是一味著名的中草药,其品质与产地密切相关。迫切需要寻找一种能快速对西红花进行产地判别的方法。基于不同产地西红花样品近、中红外光谱数据特征,采用Savitzky-Golay平滑(SG平滑)、多元散射校正、标准正态变量变换、一阶导数和二阶导数等预处理算法对光谱数据进行降噪处理,可以减小试验样本、测定环境以及仪器噪音对光谱数据的影响。结合偏最小二乘判别分析(Partial least square-discriminant analysis, PLS-DA)、决策树(Decision tree, DT)和支持向量机(Support vector machine, SVM)方法分别建立近红外光谱、中红外光谱、近中红外融合光谱分类模型,并采用移动窗口偏最小二乘法(Moving window partial least square method, MWPLS)提取光谱特征区间可以提升建模速度和分类精度。基于预测结果的准确率、混淆矩阵(Confusion matrix)和ROC曲线下面积(Area under curve, AUC)以选择最优分类模型。结果显示:近红外光谱、中红外光谱与融合光谱的最佳模型组合均为基于Savitzky-Golay平滑(SG平滑)预处理的偏最小二乘判别分析法(PLS-DA),其测试集准确率分别达到94.00%、94.00%和96.00%,ROC曲线下面积分别为0.997 4、0.996 3和0.999 0,表明融合光谱可提升分类精度。特征波段的选择增强了单一光谱的分类准确率,但降低了融合光谱的分类性能。可见,结合移动窗口偏最小二乘法(MWPLS)的单一光谱技术可以精简、优化模型。所采用的方法实现了对不同产地西红花的快速准确鉴定,为西红花的产地判别提供一种新颖、快速的解决方案,有利于维护西红花市场的秩序,有助于其产业健康发展。
-
单位道地药材国家重点实验室; 南京中医药大学; 中国中医科学院