摘要
目的用机器学习算法建立IgA肾病与非IgA肾病鉴别诊断模型。方法采用回顾性研究的方法, 收集2019至2020年昆明医科大学第一附属医院、云南省第一人民医院和昆明市延安医院肾脏内科经肾脏病理确诊的患者共260例, 其中原发性IgA肾病130例, 非IgA肾病130例。收集包括性别和年龄等在内的28项临床资料和实验室常规检测结果, IgA肾病组与非IgA肾病组的男女构成比分别为59∶71和 64∶66, 年龄分别为37.20(21.89, 53.78)、43.30(27.77, 59.18)岁。将260例患者随机地分为训练集(70%, 182例)和测试集(30%, 78例)。分别使用决策树、随机森林、支持向量机、极限梯度提升算法建立原发性IgA肾病与非IgA肾病的鉴别诊断模型。以真阳性率、真阴性率、假阳性率、假阴性率、准确率、受试者特征工作曲线下面积(AUC)、精确率、召回率和F1评分综合评估各模型的效能并选择性能最佳的模型。采用 SPSS 25.0对数据进行分析, P<0.05为差异有统计学意义。结果采用决策树、支持向量机、随机森林和极限梯度提升算法建立鉴别诊断模型的准确度分别为67.95%、70.51%、80.77%和83.33%;AUC值分别0.74、0.76、0.80和0.83;判断为原发性IgA肾病的F1评分分别为0.73、0.72、0.80和0.83。综合以上评价指标极限梯度提升算法模型的效能最高, 该模型诊断为IgA肾病的敏感度、特异度分别为89%、79%, 其变量重要性由高到低分别为血白蛋白、IgA/C3、血肌酐、年龄、尿总蛋白、尿白蛋比、高密度脂蛋白、尿素。结论成功建立IgA肾病与非IgA肾病的鉴别诊断模型。采用极限梯度提升算法建立的模型临床性能最佳。
- 单位