摘要

高维光谱数据(如近红外)分析的困难在于量测的数据在呈现出很高共线性的同时,含有大量的冗余信息。本文提出了一种新的基于距离相关的偏最小二乘算法(DCPLS)。首先,基于距离相关系数对变量的重要性进行排序,距离相关系数越大,对应的变量就越重要。然后,结合PLS进行变量筛选。DCPLS是基于距离相关的向前变量选择算法。实际数据集的实验和分析表明,DCPLS能明显提高预测性能,是一种很有吸引力的高维光谱数据建模方法。