基于机器学习的2型糖尿病视网膜病变预测模型研究

作者:冯沁祺; 彭博雅; 李雅儒; 翟兴*
来源:中国中医药信息杂志, 2021, 28(06): 22-28.
DOI:10.19879/j.cnki.1005-5304.201912483

摘要

目的通过构建提升决策树、决策森林、神经网络、支持向量机等9个常用机器学习模型对2型糖尿病并发糖尿病视网膜病变进行风险预测,进行模型评价。方法采用国家人口健康科学数据中心(临床医学)的糖尿病数据集数据,采用SPSS20.0软件进行统计分析,通过卡方检验和t检验筛选糖尿病视网膜病变相关因素进入预测模型。对数据进行预处理后,使用Azure Machine Learning Studio构建9种二分类模型,采用十折交叉验证方式测试算法效能,以准确率、精确率、召回率、F1得分、AUC值为指标对模型进行评价。结果通过卡方检验和t检验得到糖尿病视网膜病变的影响因素,共筛选出年龄、血肌酐等32项计量资料指标的已有编号、指标名与结果字段进入预测模型。指标评价结果显示,提升决策树模型具有明显优势。结论提升决策树模型在9种预测模型中具有明显优势,可为2型糖尿病视网膜病变高危人群的筛检与干预研究提供一定帮助。

全文