摘要

目的在C5.0决策树算法的基础上,结合处理不平衡样本集的Easy Ensemble思想,建立患者非医嘱离院预测模型,有效识别非医嘱离院倾向患者。方法基于Easy Ensemble思想,通过Bootstrap采样方法抽取多数类样本子集组建多个新的均衡数据样本集,运用C5.0决策树算法并结合交叉验证方法与代价矩阵,训练多个基分类器,最后经Bagging算法集成,得到最终预测模型。结果在10组测试集下平均总分类准确率、平均平衡准确率、少数类别样本平均召回率和平均AUC值分别达到74.27%、82.34%、91.70%、86.21%。结论基于Easy Ensemble和C5.0决策树算法的患者非医嘱离院预测模型有较好较稳定的识别性能,为医院提升医疗质量和服务水平,降低非医嘱离院率提供了有力依据。