摘要
目的应用生物信息学分析的方法探讨特发性肺间质纤维化(IPF)中差异表达的长链非编码RNA(lncRNAs)及转录因子(TFs)。方法从NCBI基因表达芯片数据库(GEO)下载与IPF相关的三个基因表达谱(GSE2052、GSE44723以及GSE24206),根据NCBI Gene数据库及GENCODE v7数据库的基因注释信息,将下载的数据进行注释合并。然后应用R软件(3.6.0版本)的limma包,筛选出差异表达的基因(表达倍数>1或<–1,且P<0.05),并构建基因表达相关网络,采用R软件clusterProfiler包对差异表达的lncRNA及TFs进行功能富集分析,以推测其生物学功能。应用实时荧光定量聚合酶链反应验证筛选基因在IPF患者中的表达。结果筛选出8 483个差异表达的基因,其中3个GEO数据集中共有29个共同差异表达的基因,采用功能及通路富集分析注释差异表达的基因,通过蛋白质–蛋白质互作网络获得18个模块,主要涉及多聚泛素、高尔基小囊泡转运、胞内吞等功能。采用超几何检验的方法获得IPF中差异表达的lncRNAs和TFs,并且相应的基因主要涉及泛素化介导的蛋白质水解、剪切体以及细胞周期等。其中的lncM ALAT1、E2F1以及YBX1在IPF患者外周血中出现差异表达。结论lncMALAT1、E2F1以及YBX1可能是IPF发病和进展的调控基因,可为IPF的诊断治疗提供新途径。
-
单位新疆医科大学; 新疆医科大学附属中医医院; 克拉玛依市独山子人民医院