摘要

背景糖尿病肾病(DN)是糖尿病常见的微血管并发症之一,发病率高,危害性大。早期发现DN对预防相关疾病非常重要。目前大多研究基于传统的统计预测方法,数据需满足其所要求的前提假设条件。近年来已无法很好满足其在DN预测领域的需求,有必要尝试开展机器学习等新方法在DN预测领域的应用。目的 利用LASSO回归和麻雀搜索算法(SSA)优化的BP神经网络(SSA-BP神经网络)构建DN预测模型。方法 本研究时间为2023年4—8月,数据来源于公开的伊朗133名糖尿病患者的并发症数据。采用SPSS 26.0软件进行单因素分析,采用LASSO回归筛选变量。以是否患DN为因变量,分别用8∶2和7∶3的比例划分训练集和测试集,使用SSA-BP神经网络进行建模与分析,并与经典的机器学习模型对比预测性能以分析较优的DN模型。基于准确率、精确率、灵敏度、特异度、F1-score和AUC指标进行模型评价。结果 剔除9例1型糖尿病患者,本研究纳入的有效样本量为124例2型糖尿病(T2DM)患者,其中73例(58.9%)被诊断为DN患者。单因素分析显示年龄、BMI、糖尿病持续时间、空腹血糖(FBS)、糖化血红蛋白(HbA1c)、低密度脂蛋白(LDL)、高密度脂蛋白(HDL)、三酰甘油(TG)、收缩压(SBP)和舒张压(DBP)的T2DM患者DN危险因素(P<0.05)。训练集∶测试集=8∶2时,训练集(n=100)中有59例DN患者,测试集(n=24)含有14例DN患者。LASSO回归筛选出年龄、糖尿病持续时间、HbA1c、LDL和SBP共5个影响因素。Logistic回归(LR)、K近邻(KNN)、支持向量机(SVM)、BP神经网络、SSA-BP神经网络模型在测试集的准确率分别为83.33%、79.17%、79.17%、87.50%、95.83%。F1-score分别为0.846 2、0.800 0、0.800 0、0.888 9、0.960 0。训练集∶测试集=7∶3时,训练集(n=88)中有52例DN患者,测试集(n=36)含有21例DN患者。LASSO回归筛选出年龄、BMI、糖尿病持续时间、LDL、HDL、SBP和DBP这7个影响因素。LR、KNN、SVM、BP神经网络、SSA-BP神经网络模型在测试集的准确率分别为86.11%、86.11%、86.11%、72.22%、91.67%。F1-score分别为0.871 8、0.871 8、0.864 9、0.705 9、0.909 1。结论 LR、KNN和SVM模型在训练集∶测试集=7∶3时性能较好,BP神经网络和SSA-BP神经网络模型在训练集∶测试集=8∶2时性能较好。相较于BP神经网络模型和传统机器学习模型,SSA-BP神经网络模型的预测性能更佳,可及时准确识别T2DM DN患者,实现DN的早发现和早治疗,从而预防并减缓对其身体带来的危害。