摘要
采用支持向量机(SVM)、随机森林(RF)和逻辑回归(LR)等机器学习方法对脑卒中患者进行分类研究,构建脑卒中疾病预测模型,以期为疾病发生提供早期预警。对kaggle网站下载healthcare-dataset-stroke-data的数据通过SMOTE智能过抽样算法构建均衡数据集,运用支持向量机、随机森林和逻辑回归算法构建脑卒中预测模型。将SMOTE算法优化前后的预测结果进行比较分析,并采用支持向量机、随机森林和逻辑回归算法对优化后的数据集构建疾病预测模型,其结果的准确率、精确度、召回率和ROC值都有明显提高。仿真实验结果可知SMOTE+随机森林算法预测模型的准确率、精确度、ROC值都优于支持向量机和逻辑回归预测模型,可用于脑卒中疾病的早期预测,为医疗手段干预赢得时间,对降低脑卒中的发病具有重要意义。
- 单位