摘要
目的利用机器学习方法建立老年心房颤动(房颤)合并冠心病患者的远期死亡预测模型, 并确定相应的危险因素。方法回顾性队列研究, 连续入组2013年1月至2015年3月北京医院收治的60岁及以上房颤合并冠心病患者329例, 男性183例(55.6%)例, 女性146例(44.4%), 年龄(77.8±7.3)岁, 80岁及以上142例(43.2%)。失访11例(3.3%), 死亡151例(45.9%), 最后纳入分析的患者共318例。根据患者生存结局, 将318例患者分为死亡组(151例)和存活组(167例)。此外, 另选取2015年4—7月入院的60岁及以上房颤合并冠心病患者60例为外部数据验证集。采集人口统计学参数、合并疾病、辅助检查和临床治疗情况。随访至少6年, 记录包括死亡在内的主要不良心脑血管事件(MACCE)。最后将入组患者按9∶1的比例随机分为训练集和测试集, 通过机器学习算法建立不同模型预测房颤合并冠心病患者远期死亡率, 并通过外部数据(60例)验证比较确立最优模型, 利用Shapley加法解释算法对变量的重要性进行排序, 得出排名前20位的特征变量, 以确定危险因素。结果 329例患者中, 总体中位随访时间77.0月(95%CI:54.0~84.0), 失访11例(3.3%), 死亡151例(45.9%)。通过分析得出支持向量机模型、k-近邻算法(KNN)模型、决策树模型、随机森林模型、ADABoost模型、XGBoost模型、Logistic回归模型预测远期死亡率的受试者工作特征曲线(ROC)下面积(AUC)分别为0.76、0.75、0.75、0.91、0.86、0.85和0.81。其中随机森林模型预测效能最高, 其准确率达0.789, F1值高达0.806, 且优于传统的Logistic回归模型(AUC:0.91比0.81, P<0.05)。D-二聚体、年龄、MACCE次数、左心室射血分数、人血白蛋白水平、贫血、纽约心脏病协会心功能分级、陈旧性心肌梗死病史、估测肾小球滤过率(eGFR)及静息心率是预测远期死亡率的重要危险因素。结论基于机器学习方法建立的随机森林模型可预测老年房颤合并冠心病患者的远期死亡率, 具有较好的识别能力, 其准确性高于传统的Logistic回归模型。可通过干预患者的D-二聚体水平、纠正低蛋白血症和贫血、改善心功能和控制静息心室率降低远期死亡率, 改善患者远期预后。
- 单位