摘要
糖尿病是一种血糖代谢障碍的慢性疾病,可以引起高血压、心血管病变等并发症,严重影响患者的预期寿命.基于Kaggle平台提供的糖尿病数据集,首先进行探索性数据分析,然后采用支持向量机(SVM)和逻辑回归模型对其进行分类预测,以准确率和召回率为评估指标,对比分析两个算法的优缺点,同时分别采用正则化和网格搜索优化逻辑回归和SVM模型,并在不同数据集上做了验证.结果表明,相对于传统的SVM和逻辑回归,优化后的SVM和逻辑回归模型准确率分别提升1.70%和1.63%,召回率分别提升0.50%和4.26%.优化后的SVM模型准确率较高,逻辑回归模型召回率较高,两个算法各有优点.
- 单位