摘要
目的:通过生物信息学与机器学习识别溃疡性结肠炎(UC)患者的特征基因,并探索特征基因在UC中的诊断价值。方法:从GEO数据库下载与UC相关的编号为GSE87466与GSE59071的基因芯片数据,对161例UC患者和32例正常者进行差异表达基因(DEGs)筛选。使用基因本体论(GO)功能注释与京都基因与基因组百科全书(KEGG)富集分析对DEGs进行相关功能分析,利用LASSO回归模型与支持向量机递归特征消除(SVM-RFE)分析识别UC的生物标志物,并通过ROC曲线评估区域特征基因的区分能力。在GSE38713外部验证数据集(13例UC患者和15例正常者)中进一步验证UC生物标志物的表达水平。结果:共识别出91个DEGs,主要参与IL-17信号通路、细胞因子-细胞因子受体相互作用、病毒蛋白与细胞因子和细胞因子受体的相互作用抗病毒、TNF信号通路、趋化因子信号通路等与免疫相关的信号通路。基于机器学习共鉴定出SLC6A14与TIMP1两个特征基因,并通过ROC曲线分析与外部验证数据集验证,发现这两个特征基因可作为诊断生物标志物,且具有较高的诊断价值。免疫细胞浸润分析结果表明,SLC6A14和TIMP1与活化的CD4记忆性T细胞、未活化的自然杀伤细胞、M0巨噬细胞、M1巨噬细胞、活化的树突状细胞、活化的肥大细胞、中性粒细胞、浆细胞、CD8 T细胞、调节性T细胞、活化的自然杀伤细胞、M2巨噬细胞、未活化的树突状细胞、未活化的肥大细胞相关。结论:SLC6A14与TIMP1两个特征基因可作为UC的诊断生物标志物,且与UC的病理生理过程密切相关。
- 单位