摘要

目的机器学习是人工智能的一个重要分支及支撑技术, 本研究拟比较基于基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS)技术的4种肺炎克雷伯菌对亚胺培南药物敏感性机器学习预测模型的诊断效能。方法回顾性研究。收集2019年1月至2020年12月天津市海河医院检验科微生物室临床标本中分离的684株肺炎克雷伯菌的MALDI-TOF MS质谱峰和亚胺培南药敏数据, 从中按照简单随机方法选取亚胺培南敏感株和耐药株各70株的质谱峰数据作为训练集, 以及敏感株和耐药株各30株建立测试集模型, 对上述200份标本的质谱峰数据经归一化处理后进行正交偏最小二乘判别分析(OPLS-DA)后, 再分别通过最小绝对值选择与收缩算子(LASSO)、逻辑回归(LR)、支持向量机(SVM)和神经网络(NN)算法建立训练集数据模型, 通过网格搜索算法和10折交叉验证选取最好的训练集和测试集模型曲线下面积(AUC)和混淆矩阵, 通过测试集混淆矩阵验证预测模型的正确率。结果 OPLS-DA分析的R2Y和Q2分别为0.546 3和0.017 8, 最优的LASSO、LR、SVM和NN算法训练集和测试集的AUC分别为1.000 0和0.858 1、1.000 0和0.820 1、0.940 8和 0.756 1、1.000 0和0.697 2, 训练集模型对耐药预测准确率分别为99%(69/70)、100%(70/70)、91%(64/70)和100%(70/70), 药物敏感预测准确率分别为100%(70/70)、100%(70/70)、90%(63/70)和100%(70/70), 正确率分别为99%(139/140)、100%(140/140)、91%(127/140)和100%(140/140), 经测试集验证分别对耐药预测准确率为93%(28/30)、87%(26/30)、60%(18/30)和60%(18/30), 药物敏感预测准确率分别为100%(30/30)、80%(24/30)、93%(28/30)和67%(20/30), 正确率分别为97%(58/60)、83%(50/60)、77%(46/60)和63%(38/60)。结论 LASSO算法建立的肺炎克雷伯菌对亚胺培南药物敏感性预测模型具有较高的诊断效能, 具有潜在的临床辅助决策支持能力。