摘要

吉林地理标志大米因其品质优,口感好,营养价值高,在市场上享有较高的声誉,研究地理标志大米产地确证技术具有重要意义。以吉林省柳河县和辉南县为研究区域,分别采集柳河地理标志大米样本62个,辉南地理标志大米样本58个,共120个样本。通过检测大米样本中矿物质元素[铜(Cu)、锌(Zn)、铁(Fe)、锰(Mn)、钾(K)、钙(Ca)、钠(Na)、镁(Mg)、铅(Pb)、镉(Cd)],利用反向传播人工神经网络(BackPropagation Artificial Neural Network,BP-ANN)、随机森林(Random Forest,RF)和支持向量机(Support Vector Machines,SVM)三种机器学习方法建立确证模型,并通过F评分(F-score)方法对矿物质元素进行特征提取,采用10次10折交叉验证和混淆矩阵对研究区域建立的产地确证模型进行评估比较。结果表明:单个Cu元素可作为代表该地区空间特征的典型变量。三种机器学习方法建立的产地确证模型均达到了良好的预测性能,其中BP-ANN方法使用Cu元素和Zn元素建立的分类模型准确率为99. 7%; SVM方法使用Cu元素、Zn元素和Pb元素建立的分类模型准确率为100%; RF方法使用Cu、Zn、Pb、Ca、Cd、K 6种元素建立的分类准确率为100%。RF模型和SVM模型整体分类效果优于BP-ANN模型,模型更稳定,更适合建立研究区域的产地确证模型。