摘要

目的评估随机森林模型对肾病综合征(NS)患者5年心血管疾病风险的预测价值。方法选取陆军军医大学第一附属医院就诊的350例NS患者随访5年的诊疗资料,按照约7∶3的比例划分为训练集和测试集。模型纳入28个预测变量,通过训练集进行随机森林模型构建,测试集数据进行模型验证,选取最优节点值和决策树数目,观察变量的预测重要性并评价模型预测性能。结果随机森林模型最佳节点值为6、最佳决策树数目为446。模型中预测因子重要性排序依次为:肾小球滤过率(eGFR)、年龄、高密度脂蛋白胆固醇(HDL-C)、载脂蛋白B(apoB)、清蛋白(ALB)、载脂蛋白A1(apoA1)、纤维蛋白原(Fib)、血尿酸(UA)、低密度脂蛋白胆固醇(LDL-C)。模型预测的准确率为0.919、精确率为0.935、召回率为0.829,AUC及95%CI为0.899(0.832~0.966)。结论随机森林分类算法确定的重要预测因子可为预测NS患者5年心血管风险提供有用的信息,模型预测性能良好。