摘要
目的 评价支持向量机(SVM)、随机森林、极限梯度提升(XGBoost)3种机器学习算法与logistic回归模型在重症缺血性脑卒中30 d死亡结局预测中的效果。方法 使用2008年至2019年美国重症监护医学信息数据库Ⅳ(MIMIC-Ⅳ)中符合纳入标准的2 358例重症缺血性脑卒中患者资料,分别用SVM、随机森林、XGBoost3种机器学习算法与logistic回归方法,结合合成少数过采样技术(SMOTE)建立早期死亡预测模型,并使用ROC曲线的AUC值、准确度、F1分数、布里尔分数等指标评价模型的预测效果。结果 SVM、随机森林、XGBoost与logistic回归模型在原始不平衡数据集中预测早期死亡的AUC值分别为0.78、0.81、0.84、0.83。应用SMOTE合成数据集后,SVM、随机森林、XGBoost与logistic回归模型的AUC值分别为0.72、0.84、0.83、0.83。除SVM模型外,随机森林、XGBoost模型与logistic回归之间有相似的预测能力,但其准确度、布里尔分数均优于logistic回归模型,综合分类性能更优。结论 机器学习算法在缺血性脑卒中早期死亡预测中性能较传统logistic回归方法更优。
- 单位