摘要
平菇味道鲜美、营养丰富,深受消费者喜爱。平菇在我国的栽培范围较广,产地分散,每个产地的气候条件、栽培基质、栽培方式的差异,使不同产地生产的平菇在口感、营养价值方面会有不同。为规范平菇产品的市场管理,更为打造区域内特色平菇品牌,借助中红外光谱技术无污染、高效、低成本等特点,突破目前化学分析、生物学鉴别方法的限制,提出一种中红外光谱结合机器学习鉴别不同产地平菇的方法。对10个不同产地的平菇子实体进行红外光谱数据采集,每个地区各60份共600份样本。光谱数据经分析表明,在波段530~1 660 cm-1范围内红外光谱的相关性表现出较明显的差异。同时,基于K-S法按照训练集和测试集比例为7∶3对样品划分,得训练集为420份,测试集为180份。采用多元散射校正(MSC),标准正态变量变换(SNV),平滑(SG),一阶导数(FD),二阶导数(SD)等预处理方法进行光谱优化,去除噪声,并结合支持向量机(SVM)进行初步建模对比,得出MSC预处理后光谱数据差异性最大,预测集识别效果最好为84.44%。将MSC光谱数据进行0~1区间的归一化处理,并采用主成分分析(PCA)对其进行降维,选择满足训练集中主成分个数累积贡献率≥85%,且主成分方差百分比≥1%的前7个主成分作为输入变量与支持向量机(SVM)、随机森林(RF)、极限学习机(ELM)进行建模识别比较。实验结果表明,在识别不同产地平菇模型中,SVM模型识别效果最佳,训练集和测试集识别率均为100%; RF模型训练集识别率为100%,测试集识别率略低,为98.89%; ELM模型对比其他模型识别率较差,训练集识别率为99.28%,测试集识别率为98.33%。3种模型的识别率均高于98%,说明采用红外光谱结合机器学习的方法可以简单、快速、低成本的实现对不同产地平菇的鉴别,不仅为平菇产品产地识别提供方法依据,也为其他种类食用菌产品的产地鉴别提供参考。
- 单位