摘要
使用索马里医院提供的脑卒中患者数据集,通过四分位距(interquartile range, IQR)方法和合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)算法进行数据预处理,采用特征工程中的嵌入式方法对数据集进行特征分析,确定脑卒中诱发因素.以随机森林(random forest, RF)、极端梯度提升(extreme gradient boosting, XGB)和自适应提升(adaptive boosting, AdB)算法为第一层,高斯朴素贝叶斯(Gaussian naive bayes, GaNB)和支持向量机(support vector machine, SVM)为第二层,逻辑回归(logistic regression, LR)为元学习器构建超级学习者(super learner, SL)集成学习模型.仿真实验结果表明,相较于6种基础算法,SL模型预测效果最优,可为脑卒中的预测分析提供新的选择.
- 单位