摘要
从土壤速效钾光谱中挖掘关键特征较为困难,导致高光谱反演模型预测精度较低。针对此问题,提出了一种混合式随机森林特征选择算法。首先采用封装式特征选择方法进行特征预选,快速去除冗余并保留相关特征,然后再利用改进的随机森林特征选择算法对预处理后的特征进行精选,通过增大关键特征与冗余特征的区分度以及采用迭代特征选择的方式,使精选后的特征具有更好的鲁棒性与区分性,较好的解决了土壤速效钾高光谱反演模型精度较低的问题。为了验证所提出算法的有效性,选取了青岛市大沽河流域具有代表性的124个土壤样品为实验对象,利用提出的算法从2 051个原始波段选出含有13个敏感波段的最优光谱子集建立土壤速效钾反演模型,并与现有特征选择算法所建模型进行对比分析。结果表明:该算法构建的回归模型具有较低的预测均方根误差RMSEP(9. 661 5),较高的相关系数r(0. 936 9)和预测分析相对误差RPD(2. 14)。混合式随机森林特征选择算法以较少的特征波长数实现了较好的预测效果,可为土壤养分实时光谱传感器的设计提供一定的理论依据。
- 单位