摘要

目的 旨在通过生物信息学和机器学习寻找溃疡性结肠炎诊断的潜在生物标志物,并分析其免疫浸润特征。方法基于三个GEO数据库(GSE9452、GSE38713和GSE36807)的数据集进行分析,首先将数据集合并,用R软件“limma”包筛选溃疡性结肠炎与正常样本结肠黏膜组织的差异表达基因(DEGs),对DEGs进行基因本体论(GO)和京都基因与基因组百科全书(KEGG)富集。采用最小绝对值收敛和选择算子(LASSO)和支持向量机-递归特征消除(SVM-RFE)筛选出关键基因。利用CIBERSORT对UC的免疫浸润特性进行了探索,并进一步分析关键基因与不同免疫细胞之间的关联。最后在不同探针平台的独立数据集(GSE13367)中验证关键基因的表达水平,采用受试者工作特性曲线(ROC)评估关键基因的诊断效能。结果GSE9452、GSE38713和GSE36807数据集共筛选出182个差异基因,包括55个下调基因和127个上调基因。功能富集分析表明DEGs主要参与体液免疫反应、含胶原蛋白的细胞外基质、细胞因子活性、细胞因子-细胞因子受体的相互作用等。通过两中机器学习算法及验证集验证,最终确立了DPP10、SLC16A9和REG4是UC的潜在生物标志物。CIBERSORT免疫浸润分析显示UC与正常对照组织的免疫浸润特性有显著差异,下调基因DPP10、SLC16A9的表达水平与活化的CD4记忆性T细胞、巨噬细胞(M0和M1)、中性粒细胞负相关,与M2巨噬细胞呈正相关;而上调基因REG4的表达水平则与中性粒细胞正相关,与调节性T细胞、M2巨噬细胞负相关。GSE13367数据集构建诊断UC疾病的ROC曲线显示,DPP10(AUC=0.990)、SLC16A9(AUC=0.914)、REG4(AUC=0.960)均具较高诊断价值。结论 DPP10、SLC16A9和REG4可能通过调节M2巨噬细胞、中性粒细胞等几种免疫细胞参与UC的发生与进展,可被用作UC诊治的关键生物学标志物。

  • 单位
    徐州市第一人民医院