摘要

傅里叶变换红外光谱通常包含有大量的波长变量点,对其进行定性分析需要建立稳健的、可解释性的分类模型。稀疏线性判别分析(SLDA)是一种较为新颖和有效的机器学习算法,常用于高维度、小样本数据的变量筛选和判别分析,SLDA通过在线性判别分析中引入正则项,使分类器训练过程和变量选择过程同时完成,不同判别方向上载荷系数的稀疏性则增强了模型的可解释性。采集甘肃不同产地的秦艽样本94个,其中麻花秦艽(Gentiana straminea Maxim)30个,黄管秦艽(Gentiana officinalis)28个,大叶秦艽(Gentiana macrophylla Pall)36个,利用傅里叶变换红外光谱法获得所有样本的光谱图。取其中70个样本构成训练集,剩余24个为测试集。使用训练集建立SLDA模型,对2个判别方向上不为0的载荷系数个数进行网格化寻优,得到了最优的参数空间。利用建立的SLDA模型对测试样本进行预测,其分类准确率达到100%,实现了对三种秦艽的快速、准确鉴别。实验结果表明,与PLS-DA方法相比,SLDA模型在分类准确率、稀疏性及可解释性方面均具有一定优势,是一种新颖、有效的光谱定性分析方法。