摘要
目的 建立广西、湖南、四川、陕西和西藏产地黑茶高效液相色谱(highperformanceliquid chromatography,HPLC)指纹图谱,并结合化学计量学与机器学习对黑茶进行产地识别研究。方法 采用高效液相色谱-二极管阵列检测器(high performance liquid chromatography-diode array detector, HPLC-DAD)检测48份不同产地黑茶的化学成分,并建立指纹图谱;利用没食子酸、表没食子儿茶素、表儿茶素没食子酸酯、表儿茶素、儿茶素、咖啡碱和表没食子儿茶素没食子酸酯7种对照品对图谱共有峰进行指认;结合化学计量学和不同机器学习算法建立黑茶产地识别模型,并使用准确率、精确率、召回率及F1分数作为机器学习产地识别模型的评价指标。结果 黑茶指纹图谱共识别出8个共有峰,指认其中7个成分;基于指纹图谱8个共有峰峰面积建立的化学计量学和机器学习的产地识别模型中显示,偏最小二乘法-判别分析模型能识别部分产地黑茶,并筛选出4个差异标志物,其预测准确率为54.2%,逻辑回归(logistic regression, LR)、反向传播神经网络(back propagation neural network, BPNN)、支持向量机(support vector machine, SVM)、随机森林(random forest,RF)和决策树(decision tree, DT)算法模型预测准确率分别为66.7%、90.0%、90.0%、80.0%和80.0%,其中, SVM模型的产地识别效果最好。结论 我国不同产地黑茶化学成分含量存在一定差异,HPLC指纹图谱结合SVM能够较好对黑茶产地进行溯源研究。
- 单位