摘要

为了消除近红外光谱波长变量数量多,强度弱以及重叠严重等因素对预测结果的影响,提出了基于波长变量聚类与剪枝的集成学习模型。对波长变量进行聚类,在此基础上根据预测值与真实值的最大绝对误差和方差进行剪枝,有效减少变量的个数。从剪枝后的聚类中多次抽取子训练集并构建集成学习模型CTV-PLS。数值实验中,四种方法的比较表明CTV-PLS在大多数情况下其预测精确度占优,真实值与预测值的相关性均超过94%。