摘要

采用国家人口与健康科学数据共享平台临床医学科学数据中心提供的3 000例糖尿病并发症数据作为数据集,对糖尿病联合并发症发病风险进行计算与预测.通过关联规则查找高风险联合并发症并计算各联合并发症的关联发病率,采用随机森林算法建立高风险联合并发症发病预测模型,并查找其关键影响因素.研究结果表明:部分联合并发症关联发病率超过90%;在筛选出的12组高风险联合并发症中,高血压、动脉粥样硬化、视网膜病变、冠心病、肾病等是常见并发症;不同的联合并发症中关键影响因素(生化指标)各不相同;各联合并发症十折交叉验证法的分类平均精度均在0.800 0以上,曲线下面积(AUC)值均大于0.67.