摘要

近红外光谱存在高维、噪声大、重叠和非线性等特性,严重影响建模准确,因此提出了一种基于联合矩阵局部保持投影(JMLPP)的特征提取方法。首先,利用基于聚类的光谱特征选择方法对原始近红外光谱数据进行有效特征提取,按种与分类相关性强的指标将样本分为种不同的聚类方式,依据类内关联性强,类间差异性大的聚类思想,通过调节类内参数、类间参数确定类内阈值与类间阈值,分别对种不同聚类方式筛选光谱特征区间,得到指标特征矩阵,并集操作生成联合矩阵。其次,从两个方面对局部保持投影算法(LPP)进行了改进:引入测地距离构造邻域距离矩阵,较欧式距离更好的表达了高维数据样本点间的拓扑结构;改进了边权矩阵,解决了样本稀疏导致的不确定性,避免了有效信息的丢失。最后,采用改进的LPP算法对联合矩阵进行降维操作,从而得到最优光谱特征子集。为验证JMLPP算法有效性,首先从光谱投影方面将该算法与PCA、 LPP算法进行了对比,结果表明JMLPP算法有较好的等级区分能力,投影空间中的烟叶样品分类清晰,明显优于PCA与LPP算法。其次从模型分类准确性方面进行了对比,分别采用全谱段与PCA, LPP和JMLPP降维后的特征建立烟叶等级分类模型,实验结果表明, JMLPP算法建立的分类模型准确率为93.8%,对5种烟叶分级的敏感度分别为95.2%, 93.1%, 94.2%, 92.1%和92.5%,特异度分别为99.3%, 98.4%, 98.6%, 97.5%和97%,模型准确率、敏感度与特异度均明显优于其他3种方法。该算法通过基于聚类的特征提取和改进的局部保持投影算法实现了烟叶分级特征的有效提取,并保留原始数据的局部线性关系,使最终建立的模型具有良好的稳定性和较高的准确性。