摘要

针对近红外光谱数据的维度高、特征之间存在严重的多重共线性的特点,提出了无迁移标准的通过校正分布差异的标定迁移方法(calibration transfer via correcting distributions difference,CT-CDD). CTCDD首先建立主仪器的偏最小二乘模型,然后通过偏最小二乘模型提取主仪器和从仪器的潜变量,并且分别对主仪器和从仪器的潜变量进行聚类.该方法基于这样的假设:聚类后的主仪器和从仪器的每一部分特征光谱均服从单高斯分布.最后,找到2个仪器的最接近的子分布,通过校正均值和方差来校正数据分布的差异.实验结果表明CT-CDD通常更加鲁棒并且还可以实现最低的均方根预测误差.