2型糖尿病风险预测模型的比较

作者:毕迎春; 王培培; 潘媛媛; 甘良进; 叶明全
来源:电脑知识与技术, 2020, 16(28): 8-17.
DOI:10.14004/j.cnki.ckt.2020.3154

摘要

目的:探讨分类算法在2型糖尿病风险预测中的应用价值。方法:针对Pima Indians Diabetes数据集,经过2种情况的数据预处理,选择逻辑回归、支持向量机、多层感知机、随机森林等4种分类算法分别构建2型糖尿病风险预测模型,分析对比准确率和F值等评价指标,以验证其对具有空值数据集的应用性能。结果:经过比较,对原始数据进行分类预测时,多层感知机的值最高,随机森林的值最低,4种分类算法对删除属性后的数据集也取得了较好的预测效果。结论:分类算法可以有效预测2型糖尿病,并对具有一定缺失值的数据集具有良好的实用价值。