摘要
仿刺参富含多种活性物质,具有极高的药用价值和经济价值,是水产行业不可或缺的养殖资源。不同产地的地理环境与营养结构存在显著差异,所以仿刺参的生长周期与养殖成本相差巨大。消费者在购买仿刺参时,会将产地信息作为选择的首要因素,因为仿刺参的产地直接反映了食品具有的营养价值。不同产地仿刺参的价格差距悬殊,面对利益的诱惑,产地欺诈事件屡禁不止。因此,研究一种准确率高、稳定性好具有优秀泛化能力的仿刺参产地信息认证方法,能够有效维护品牌产地从业者与消费者的切身利益。氨基酸是仿刺参营养富集的主要物质,通过氨基酸特征能够分析出摄食初级生产者的组成,可以作为产地信息认证的有效工具。气相色谱-质谱分析(GC-MS)技术能够产生独特的化学指纹图谱用于产地信息鉴别。对9个产地的156个仿刺参样品,进行酸水解、衍生化和酯化等操作,通过GC-MS测定出氨基酸含量与氨基酸碳稳定同位素数据。进行置信水平为95%的图基检验,并利用箱型图检查数据分布,筛选出13种氨基酸含量和10种氨基酸碳稳定同位素数据。主成分分析能够在降低数据维度的同时,挖掘出有价值的信息,聚集产地识别特性,提高运算速度与认证精度。通过交叉验证,选取前5个主成分作为氨基酸含量和氨基酸碳稳定同位素模型的输入,累计贡献率分别为98.727%与95.982%。为了充分挖掘出隐藏在氨基酸数据背后的价值,选取了8个家族的12个机器学习方法,共构建出24个单体分类器,根据数据自身特征找到最优的认证方法。应用基于遗传交叉因子改进的粒子群优化算法进行模型参数的优化,得到性能最佳的单体分类器。结果表明,氨基酸碳稳定同位素数据具有更优的产地认证特性,高斯径向基为核的支持向量机与K邻近算法为最佳的两个分类方法。最后利用集成学习汇集单体分类器的优势,构建了一种融合多源数据处理方法的仿刺参产地信息认证方法,模型的平均准确率为99.67%。建立了仿刺参产地信息认证系统,为主管机关监管与消费者维权提供了简单可行的手段,能够有效监管与防止仿刺参产地欺诈事件的发生,保障了水产养殖行业的稳健发展。
-
单位大连海事大学; 环境科学与工程学院