摘要

目的介绍10折交叉验证的基本原理,用实例说明基于R语言的10折交叉验证在预测模型泛化能力评价中的应用。方法使用以10折交叉验证法为评价方式的logistic回归模型,对耐药性结核病患者治疗结局进行预测。同时使用5折、20折及留一交叉验证法,对比所得评价指标。结果不同训练集和测试集的划分方法对模型评价指标具有一定影响。相对于其他交叉验证方法,10折交叉验证的各项评价指标稳定性、运行效率均更佳。结论在机器学习模型的应用效果评价中,10折交叉验证的综合性能较好,可客观地测评不同模型的泛化能力。

  • 单位
    中山大学公共卫生学院