摘要
目的 基于高光谱成像技术结合机器学习建立一种青花椒产地的快速识别方法,实现四川、贵州、云南、重庆等10个青花椒主要产地样品的快速无损鉴别。方法 本研究利用全平皿法、五点平均法和中心点法3种不同的兴趣区域(region of interest, ROI)提取方式,获得平行光谱数据,分别采用5种预处理方法消除数据噪声提升模型性能,并比较了偏最小二乘判别分析(partial least square-discriminant analysis, PLS-DA)、随机森林(random forests, RF)和支持向量机(support vector machine, SVM) 3种模型的产地识别效果。结果 采用全平皿法提取兴趣区域,通过二阶导(second derivative, D2)预处理后建立的RF模型分类效果最佳,训练集和测试集的准确率均可达到100%。进一步采用连续投影算法(successive projections algorithm, SPA)选择27个特征波长建模,结果表明多元散射校正(multiplicative scatter correction, MSC)-RF模型判别效果最优,训练集准确率为98.8%,测试集准确率达到98.3%。结论 本研究建立的方法可实现不同青花椒主要产地样品的快速无损鉴别,为高光谱成像技术在食品和药品领域的推广应用及专属小型化仪器装备系统的开发提供了理论依据。
-
单位江西省道地药材质量评价研究中心; 中国中医科学院; 浙江科技学院