摘要

目前,近红外光谱(NIRS)可以实现种子活力的快速、无损检测,但区分的活力等级一般少于3级且精度不高。建立种子活力多等级、高精度的NIRS检测模型,解决活力等级增加与预测模型精度之间的矛盾是现阶段近红外种子活力检测的主要任务。以玉米种子为研究对象,采用人工老化的方法获得5种活力等级的种子样本并采集对应的光谱数据建立反向神经网络(BP)预测模型。为了提高模型的精度和稳健性,提出一种耦合平均影响值-连续投影特征波长提取算法(MIVopt-SPAsa)。该算法针对连续投影算法(SPA)耗时过长的问题,采用平均影响值算法(MIV)对其预降维。MIV方法实现了对波长影响值的排序,但缺乏选取波长影响阈值的指标,因此引入相对距离比对MIV算法进行优化(MIVopt),实现特征波长范围的有效分割。针对SPA提取特征变量数目确定的问题,设定了特征波长数目范围并在此范围内优中选优,实现了自适应的SPA(SPAsa)特征提取。使用耦合MIVopt-SPAsa算法对具有1 845个波长的玉米种子近红外全谱数据进行特征提取,提取出特征波长37个,主要分布在玉米种子近红外光谱的7个主要吸收峰附近,表明该算法可以有效提取出与玉米种子生化物质近红外吸收特性一致的特征波长。为了测试该算法对模型性能的影响,建立了全谱BP模型、 MIV-BP模型、 SPAsa-BP模型、 MIVopt-SPAsa-BP模型和竞争自适应重加权CARS-BP模型对5个等级的玉米种子活力进行分级,MIVopt-SPAsa-BP模型的预测平均准确率可达99.1%,预测精度高于其他模型;其计算平均时间为14.382 s,低于MIV-BP模型的计算时间(24.523 s)、 CARS-BP模型的计算时间(97.226 s)和SPAsa-BP模型的计算时间(101.224 s),但高于全谱模型的平均计算时间(0.253 1 s);其最佳表现交叉熵为0.007 892,远远低于另外4个模型。实验结果表明:MIVopt-SPAsa算法可以有效地提高玉米种子活力近红外检测模型的精度,实现种子活力多等级、精确、无损检测,为种子活力检测模型的优化提供参考。