摘要

目的 筛选2型糖尿病患者群合并冠心病危险因素并建立风险分类模型,为临床辅助诊断提供有价值的参考。方法 通过重庆医科大学大数据平台收集出院时间为2014年1月1日至2019年12月31日行冠状动脉造影术的2型糖尿病患者944例,根据造影结果分为2型糖尿病合并冠心病715例(T2DM-CAD组)和2型糖尿病非冠心病229例(T2DM组)。采用倾向得分匹配法(Propensity Score Matching,PSM)均衡组间混杂因素的影响,匹配后T2DM-CAD组389例,T2DM组221例。使用单因素分析与Logistic回归筛选冠心病发病的危险因素。采用贝叶斯优化(Bayesian Optimization,BO)算法优化支持向量机(Support Vector Machine,SVM)模型、随机森林(Random Forest,RF)模型、极限梯度上升(eXtreme Gradient Boosting,XGB)模型和Logistic回归模型,并比较4种分类模型的分类性能。结果 共收集缺失值<30%的指标35项,单因素分析筛选出有统计学差异的指标20项。逐步向前Logistic回归筛选出11项危险因素,包括心率、吸烟、糖尿病肾病、血肌酐、甘油三酯、脂蛋白a、白蛋白、总胆红素、谷草转氨酶、糖化血红蛋白和尿糖。基于危险因素建立的分类模型中优化后的RF模型性能在5折交叉验证(F1值=0.711,AUC=0.811)以及验证集(F1值=0.752,AUC=0.810)中表现最优。结论 建立了参数优化RF模型,可用于判断2型糖尿病患者是否合并冠心病,具有良好性能。