基于集成学习算法的慢性肾病早期筛查方法

作者:姜玉苹; 余诚; 林燕榕; 斯海燕; 刘迪; 朱江; 王浩; 陈浩
来源:西南大学学报(自然科学版), 2020, 42(10): 17-24.
DOI:10.13718/j.cnki.xdzk.2020.10.003

摘要

慢性肾病是严重危害人类健康的常见疾病,其发病率高,知晓率低.基于集成学习算法的慢性肾病早期筛查方法能够提高肾病知晓率,有利于做到早发现早治疗.搜集2016年到2019年多家医院的体检资料,选取3年内进展为慢性肾病的体检人员作为研究对象,并选取3年内没有进展为慢性肾病的体检人员作为对照组.通过5折交叉验证,采用python 3.7进行随机森林与XGBoost算法模型的训练及测试,通过进展为慢性肾病结局的F1值、真阳性和真阴性指标比较各模型对体检人员3年内是否进展为慢性肾病的预测效果.随机森林算法模型预测效果为,真阳性率0.950,真阴性率0.969,F1值0.957; XGBoost算法模型预测效果为,真阳性率0.966,真阴性率0.955,F1值0.958.