摘要
目的利用机器学习算法开发中国人群的阻塞性冠心病验前概率模型。方法纳入冠状动脉斑块早期识别与风险预警的临床注册研究(Chinese regiStry in early deTection and Risk strAtificaTion of coronary plaques, C-Strat)中疑似为冠心病而接受冠状动脉CT血管造影(CCTA)检查的29 455例就诊者, 采集人口统计学和临床信息作为预测变量。数据按7∶3的比例随机拆分为训练集和测试集, 以CCTA诊断冠状动脉狭窄大于50%作为阳性结局, 在训练集中运用极端梯度增强机(eXtreme Gradient Boosting, XGBoost)算法, 使用十折交叉验证和贝叶斯优化进行参数调优, 得到机器学习模型CARDIACS(pretest probability model from Chinese registry in eARly Detection and rIsk stratificAtion of Coronary plaques Study);使用logistic回归得到模型LOGISTIC。在测试集中验证比较CARDIACS、LOGISTIC和指南推荐的模型UDFM(Updated Diamond-Forrester Model)、DFCASS(Diamond-Forrester and CASS)。结果 29 455例就诊者年龄(57.0±9.7)岁, 女性占44.8%, 阻塞性冠心病的患病率为19.1%(5 622/29 455)。在CARDIACS模型中, 就诊原因、年龄和体重指数是最重要的预测变量。在独立的测试集中, CARDIACS的曲线下面积(AUC)为0.72(95%CI 0.70~0.73), 优于LOGISTIC(AUC 0.69, 95%CI 0.68~0.71, P=0.015)、UDFM(AUC 0.64, 95%CI 0.62~0.65, P<0.001)和DFCASS(AUC 0.66, 95%CI 0.64~0.67, P<0.001)。结论基于中国人群开发的全新的验前概率模型CARDIACS预测中国人群阻塞性冠心病的能力明显优于传统的模型, 有望辅助稳定性胸痛临床决策。
-
单位解放军总医院