摘要
目的 基于生物信息学挖掘银屑病的自噬和免疫相关特征基因,并利用机器学习及循环算法构建银屑病的预测模型.方法 (1)从GEO数据库下载与银屑病相关的基因表达数据集(GSE117239、GSE30999和GSE41662).从ImmPort数据库获取免疫相关基因(IRGs),从HADb数据库、HAMdb数据库和GSEA数据库获取自噬相关基因(ATGs).(2)针对GSE117239数据集,通过差异表达分析获取差异表达基因(DEGs),通过免疫细胞浸润特征分析获取差异免疫细胞,通过加权基因共表达网络分析获取差异免疫细胞相关基因模块和银屑病相关基因模块,通过最小绝对值收敛和选择算子算法获取自噬和免疫相关特征基因.针对自噬和免疫相关特征基因进行基因本体论(GO)功能富集分析和京都基因与基因组百科全书(KEGG)通路富集分析.(3)基于自噬和免疫相关特征基因,采用循环算法构建银屑病预测模型.绘制受试者工作特征曲线评估该模型的预测效能,并利用GSE30999和GSE41662数据集进行验证.结果 (1)共筛选出1 071个DEGs和9种差异免疫细胞.(2)将银屑病相关基因模块包含的基因、差异免疫细胞相关基因模块包含的基因分别与IRGs和DEGs、ATGs和DEGs取交集,得到95个Hub IRGs和29个Hub ATGs.分别在Hub IRGs和Hub ATGs中获得42个免疫相关特征基因和14个自噬相关特征基因.GO功能富集分析结果显示,免疫和自噬相关特征基因分别涉及814个、706个GO条目;KEGG通路富集分析结果显示,免疫相关特征基因主要富集在趋化因子信号通路、Janus激酶-信号转导和转录激活因子信号通路和Th17分化等信号通路,自噬相关特征基因主要富集在白细胞介素17信号通路、肿瘤坏死因子信号通路、流体剪切应力与动脉粥样硬化、NOD样受体信号通路等信号通路.(3)循环算法结果显示,基于包含14个基因(S1 00A8、CCL2、EGF、WNT5 A、RORC、TNFRSF4、PAK3、TRBC1、PRKCQ、MTCL1、SVIP、LAMP3、SPTLC2、PDK4)的基因组合构建的银屑病预测模型具有较高预测性能.结论 42个免疫相关特征基因和14个自噬相关特征基因与银屑病密切相关,其中包含S100A8、CCL2、EGF、WNT5A、RORC、TNFRSF4、PAK3、TRBC1、PRKCQ、MTCL1、SVIP、LAMP3、SPTLC2、PDK4 的基因组合对银屑病具有较高的预测性能,这14个基因有望成为诊断银屑病的潜在生物标志物.