摘要
采用近红外光谱技术,对采自9个产区280批次干姜药材样本进行分析,获取其近红外光谱信息,并运用主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)、正交偏最小二乘判别分析(OPLS-DA)及K-近邻(KNN)、支持向量机(SVM)、随机森林(RF)、人工神经网络(ANN)和梯度提升(GB)等机器学习算法对干姜药材进行产地溯源研究。结果显示,标准正态变量变换结合一阶导数的光谱预处理判别准确率为93.9%,可用于判别模型的建立。PCA和PLS-DA结果显示,四川、山东、云南、贵州产区的干姜药材样本可实现有效区分,其余产地样本存在部分重叠。采用机器学习算法对不同产区样本进行建模并验证分析,结果显示KNN、SVM、RF、ANN、GB算法的AUC值分别为0.96、0.99、0.99、0.99、0.98,整体预测准确率为83.3%、89.3%、90.5%、91.7%、89.3%,表明所建立模型可靠,提示机器学习算法结合近红外光谱的产地识别方法可用于干姜药材产地溯源。道地药材川干姜与非道地产区干姜的OPLS-DA结果显示,道地产区的干姜药材可与其余产区干姜药材显著区分,并显示出较好的判别准确率,提示该研究建立的近红外光谱技术结合化学计量学方法可作为川干姜道地药材的鉴别手段。该研究为干姜产地溯源提供了快速、无损的检测手段及可靠的数据分析方法,可望为中药材产地溯源研究提供新的方法参考。
-
单位南京中医药大学; 道地药材国家重点实验室; 中国中医科学院