摘要

宁夏产地的宁夏枸杞属于《中华人民共和国药典》收录的道地药材,药用价值较高、消费者青睐度更高,然而优质宁夏枸杞的种植面积较小、产量较低、枸杞子市场以乱充好、以其他产地冲抵道地产区产品的现象频发。因此,建立快速有效的宁夏枸杞产地鉴别模型对监督市场具有重要的意义。日常的市场交易枸杞子的鉴定一般凭借经验,但是该方法误差较大,可信度较低。传统的理化实验鉴别周期较长,非专业人员无法操作。近些年一些学者研究发现不同产地的宁夏枸杞成分含量具有差异性,然而枸杞子样本较小、形状不规则、成分分布不均匀,近红外光谱鉴别通常需要碾碎成粉末然后采集光谱信息,无法做到无损批量地采集枸杞子数据来鉴别枸杞子产地。近红外高光谱图像结合了近红外光谱和图像,包含丰富的空间信息和光谱信息,可以实现无损批量地采集非均匀样本光谱信息。利用近红外高光谱图像对甘肃、青海、新疆、宁夏和内蒙5个产地的宁夏枸杞进行产地鉴别。使用近红外高光谱图像系统采集了1 650个样本数据之后,通过阈值分割、图像去噪等方法提取出感兴趣区域(region-of-interest,ROI)。对比了ZCA白化(zero-phase component analysis whitening)预处理方法和常用的标准化(normalization)预处理方法,实验结果表明ZCA白化预处理是一种有效的高光谱数据预处理方法,可以去除特征之间的相关性,提升产地鉴别模型的准确率。对预处理后的数据采用偏最小二乘降维(partial least squares based dimension reduction,PLSDR)降低模型复杂度,结果表明经过ZCA白化预处理后的数据可以由288维特征降低到4个主成分,使得去除相关性后的特征可以被更少的隐藏特征来表示,这样可以极大程度上降低模型复杂性。最后,将降维后的特征输入到不同的分类器中进行训练,包括支持向量机(support vector machine,SVM)、 Fisher线性判别分析(linear discriminant analysis,LDA)和Softmax分类。其中,基于ZCA白化、 PLSDR和Softmax分类的模型表现最好,在测试集上的平均准确率为94.06%,可以有效的鉴别宁夏枸杞产地。