融合LightGBM与SHAP的糖尿病预测及其特征分析方法

王鑫; 廖彬; 李敏; 孙瑞娜

摘要

人工智能在辅助医疗诊断方面得到广泛关注，对糖尿病预测的相关研究是近年来关注的一个热点问题。以皮马印第安人糖尿病数据集为研究对象，首先，对原始数据进行缺失值填充、异常值分析、标准化处理等工作的基础上，将预处理后的数据作为LightGBM训练模型的输入；其次，与已有工作中基于SVM、随机森林、决策树以及Xgboost等多种机器学习模型进行实验对比，结果表明本文模型在准确率、精确率、召回率、F1值、AUC值5项性能指标上均明显优于对比模型；最后，引入SHAP模型增强模型的可解释性，同时综合比较了LightGBM和Xgboost的特征重要性排序结果，识别出了影响糖尿病的主要因素，为糖尿病的疾病诊断提供决策参考。

单位
新疆大学; 新疆财经大学; 中国科学院信息工程研究所; 中国科学院大学

收藏分享被引浏览

更新时间：2021-11-10 01:37

融合LightGBM与SHAP的糖尿病预测及其特征分析方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友