基于数据融合策略的红茶发酵程度判别

作者:张柏; 凌彩金; 李露青; 周巧仪; Zhenfeng Li; 宋飞虎; 宋春芳
来源:农业工程学报, 2022, 38(15): 339-347.
DOI:10.11975/j.issn.1002-6819.2022.15.037

摘要

发酵是红茶加工过程中关键的一道工序,对红茶的品质形成有着重要影响。该研究以大叶种英德红茶中的英红九号为研究对象,试验收集了204份不同发酵时间的红茶样品并使用便携式近红外光谱仪和工业相机获取红茶发酵中的信息,基于近红外光谱数据、图像数据和数据融合策略分别建立了红茶发酵程度判别模型。通过分析茶多酚和儿茶素类含量的变化,将红茶的发酵划分为3个阶段,即发酵不足、发酵适度和发酵过度。采用Savitzky-Golay光滑对原始光谱进行预处理,利用竞争自适应重加权采样(Competitive Adaptive Reweighted Sampling, CARS)、连续投影算法(Successive Projections Algorithm, SPA)和主成分分析(Principal Components Analysis, PCA)对近红外光谱变量进行降维处理;相应地,图像进行去阴影后提取了9个颜色特征变量,采用皮尔森(Pearson)相关分析和主成分分析进行特征变量提取。最后采用线性判别分析(Linear Discriminant Analysis, LDA)和支持向量机(Support Vector Machine, SVM)分别建立了基于近红外、图像和两者数据融合的分类模型。结果表明,在建模数据相同的条件下,非线性的支持向量机模型性能优于线性判别分析模型。单一传感器数据建模效果不佳,近红外光谱和图像判别模型的预测集最大准确率仅为83.82%和73.53%。低层次数据融合建模效果较单一传感器数据建模无明显提升,而中层次的数据融合建模效果比单一数据建模均有显著提高,其中SPA提取光谱变量结合Pearson提取图像变量建立的判别模型效果较佳,校正集和预测集准确率分别达到了97.06%和95.59%。研究表明,近红外光谱和视觉结合的中层次融合策略可以作为一种快速判别红茶发酵程度的方法,研究结果为红茶发酵程度构建等级模型与判别奠定了一定的理论基础,为红茶发酵的自动化检测提供了重要依据。

全文