随机森林反演绿洲土壤水分的特征参数优化降维方法

作者:杨丽萍; 王彤; 苏志强; 侯成磊; 冯瑞
来源:西北大学学报(自然科学版), 2022, 52(02): 181-191.
DOI:10.16152/j.cnki.xdxbzr.2022-02-003

摘要

为解决植被覆盖区土壤水分反演的复杂性问题,以内蒙古西部的额济纳绿洲为研究区,针对草地、耕地、林地以及总体样本等不同情况,基于Radarsat-2 C波段全极化合成孔径雷达(polarimetric synthetic aperture radar, PolSAR)数据,利用标准强度和相位处理以及多种目标极化分解方法,提取特征参数,采用平均精度减少MDA、多重共线性检验与PCA主成分分析方法进行优化降维,建立土壤水分反演的多种随机森林模型。以训练集、验证集的决定系数R2和均方根误差RMSE为指标,综合评价模型精度。结果表明:(1)相较于采用单极化和双极化数据的single和dual方案,基于全极化数据的quad方案在一定程度上可提高水分反演精度;与后向散射信息相比,基于极化特征参数的模型水分反演精度相对较高;与基于特征值分解的特征参数相比,基于模型分解的特征参数在土壤水分反演中具有更大潜力。(2)经MDA重要性评分的M3和M11方案的精度分别高于输入特征相同的三个3分量方案和H-A-α分解的11分量方案,体现出MDA重要性评分的有效性。适度增加特征个数对模型精度有积极影响,但参数过多会出现多重共线性问题。(3)经过MDA重要性评分以及多重共线性检验和PCA优化降维的M11+PCA与MALL+PCA方案精度明显提高,说明PCA分析不仅具有提高模型精度的作用,而且可实现降维,为模型“减重”,提高运算效率。

全文