摘要

目的探索基于不平衡数据构建预测非肾病水平蛋白尿的膜性肾病预后的机器学习模型。方法回顾性分析山西省人民医院2018年1月至2021年12月肾活检诊断为非肾病水平蛋白尿的膜性肾病患者的临床和病理资料。基于logistic回归、支持向量机(SVM)和轻量梯度提升(lightGBM)3种机器学习算法构建预测模型。采用混合采样技术处理不平衡数据, 使用受试者工作特征曲线下面积(AUC)评估模型预测性能, 运用Shapley加法解释(SHAP)对最佳性能模型的结果进行解释。结果共纳入148例患者, 男84例, 女64例, 年龄(47.2±12.5)岁, 随访时间[M(Q1, Q3)]14(7, 20)个月。23例(15.5%)患者发生肾脏终点事件。SVM模型的AUC值最高(0.868, 95%CI:0.813~0.925), 其次为logistic回归(AUC:0.865, 95%CI:0.755~0.899)和lightGBM(AUC:0.791, 95%CI:0.690~0.882)。基于随机森林的特征递归消除交叉验证(RFECV)方法和SVM模型的SHAP图显示, 免疫组化IgG、血清总蛋白(TP)、血清抗磷脂酶A2受体抗体(anti-PLA2R)、血氯、D-二聚体是影响非肾病水平蛋白尿的膜性肾病预后的危险因素, 其中免疫组化IgG、anti-PLA2R、D-二聚体水平越高, 患者达到肾脏终点事件的风险越高。结论本研究建立的SVM模型可有效预测非肾病水平蛋白尿的膜性肾病的预后, 为早期识别高危患者及精准治疗提供了新方法。