摘要
目的采用梯度提升机与随机森林法对在天津市胸科医院行CABG手术后出现复发缺血性症状的患者是否会发生SVGD进行预测,并评价两种模型的分类性能。方法将606例研究对象按7:3比例随机分为训练集和测试集进行模型训练和测试。用NRI和IDI评价两种集成算法对CART基分类器的提升程度,并采用诊断试验评价指标对模型的分类性能进行评价。结果以CART基分类器为参照,梯度提升机的NRI和IDI分别为0.31和0.15,而随机森林NRI和IDI分别为0.08和0.08。在测试集上GBM的AUC和ACC分别为0.89和0.83高于RF 0.80和0.73。二者筛选出的最重要的5个临床指标相同,依次为桥龄、左室舒张期径长、VLDL、隐静脉桥支数和心脏病类型。结论梯度提升机和随机森林法均能提升基分类器的分类性能,且前者优于后者。梯度提升机比随机森林有更好的泛化能力,更适合对外部数据的分类预测。
-
单位天津市胸科医院; 公共卫生学院; 天津医科大学