摘要

目的:运用生物信息学分析方法挖掘大数据中肺结核相关的关键基因,为进一步探索肺结核可能的潜在调控靶点提供理论依据。方法:从基因表达数据库(GEO)下载与肺结核相关的高通量基因表达谱芯片数据,应用R语言筛选肺结核患者与正常人差异基因;对差异表达基因进行基因本体(GO)功能富集分析和DisGeNET模块相关疾病谱分析,蛋白质相互作用网络的构建及可视化分析。结果:得到46个差异表达基因。GO功能富集分析发现这些基因主要涉及免疫反应、正性调控等生物学过程。疾病谱分析结果主要富集在肺部炎症、器官发育等。基于String数据库构建蛋白互作网络,进一步筛选出肺结核候选基因,包括SERPINA1、MAPK14、CKAP4、CXCR1、SELL、GNG11、GZMK、KLRC1、SDC2、NCF4和IL1RN。结论:SERPINA1、MAPK14、CKAP4、CXCR1、SELL、GNG11、GZMK、KLRC1、SDC2、NCF4和IL1RN可能是肺结核相关的关键候选基因,为该疾病进一步的功能研究提供了理论依据。通过大数据对疾病谱基因组数据平台挖掘,能够为疾病高危基因组识别及疾病预防提供重要的借鉴意义。

  • 单位
    西安交通大学第一附属医院