基于随机森林和梯度提升决策树的高血压分析预测

作者:沈赛拉; 钟锋*; 梁兴; 陈思悦; 沈诗钰; 陈璐静
来源:计算机时代, 2023, (05): 15-19.
DOI:10.16644/j.cnki.cn33-1094/tp.2023.05.004

摘要

为进行高血压的危险因素分析与预测,提出一种基于随机森林和梯度提升决策树的模型。首先基于体检报告数据进行缺失值处理、one-hot编码、归一化、数据初步聚类等预处理;然后针对数据样本不均衡的特性,利用SOMTE算法进行重采样,基于随机森林得到特征重要性评分并进行特征选择;最后基于排名前20的特征值,利用梯度提升决策树算法产生预测模型。模型分析结果显示了高血压的危险性因素。经数据集交叉验证,模型准确率可以达到84.51%,具有较高的应用价值。

  • 单位
    浙江外国语学院

全文