摘要
目的 探索基于极端梯度提升(extreme gradient boosting, XGBoost)算法构建的高血压识别模型性能。方法 本研究收集了2020年1月至12月南京大学附属鼓楼医院健康管理中心健康体检人群中1577位高血压确诊患者和3754位同期健康对照的相关数据,采用单因素分析对高血压影响因素进行筛选,基于XGBoost算法和自适应增强(AdaBoost)算法构建高血压识别模型,采用留出法验证模型泛化性能,灵敏度、特异度、阳性预测值、准确度、G-mean、F-measure、马修斯相关系数(MCC)和受试者特征曲线下面积综合评价和比较模型性能。结果 XGBoost模型灵敏度(90.3%)、特异度(86.8%)、阳性预测值(87.3%)、准确度(88.6%)、G-mean(0.886)、F-measure(0.888)、MCC(0.772)和受试者工作特征曲线下面积(0.954)表明其具有更好的识别高血压患者的能力。结论 XGBoost算法对识别高血压患者具有较强的实用性和可行性,为未来类似研究提供一定的模型选择参考。
-
单位公共卫生学院; 东南大学; 南京大学医学院附属鼓楼医院