摘要

<正>糖尿病是多发慢性病,如何准确预测是否患有糖尿病以及找到影响糖尿病的因素对预防和控制糖尿病显得尤为重要。本文通过几种机器学习算法分析一组糖尿病数据比较几种模型的优劣及影响糖尿病的主要因素。首先在训练集上通过交叉验证找到每个模型的最优参数,然后根据混淆矩阵图计算出每个模型的F1-score作为模型的评价标准。

全文