摘要

目的利用生物信息学方法分析非小细胞肺癌(NSCLC)基因表达谱芯片,筛选相关差异基因,探讨NSCLC潜在的生物标志物。方法美国国立生物信息技术信息中心的GEO数据库下载相关芯片数据(研究号GSE33532),利用R软件及affy、limma、pheatmap、ggplot2等软件包进行差异基因筛选;使用基因本体(GO)及京都基因和基因组百科全书(KEGG)对差异基因进行相关功能及通路富集分析,并用STRING数据库及Cytoscape软件构建蛋白质-蛋白质相互作用(PPI)网络分析,筛选出核心基因。然后,以研究号GSE33745数据集为测试数据集,以PROGgenes V2在线工具对核心基因进行预后分析。结果共筛选出591个差异基因,其中上调197个,下调394个。同时差异基因GO分析,主要富集为核分裂、有丝分裂、有丝分裂细胞周期M期、细胞周期等生物学过程,而KEGG分析主要涉及细胞外基质受体相互作用、细胞黏附分子、细胞周期、p53信号通路、过氧化物酶体增殖物激活受体信号通路等相关通路。且通过STRING数据库及Cytoscape软件行差异基因PPI网络分析,计算节点的连接度,以连接度前10位为本研究的核心基因,生存分析提示:细胞周期蛋白B1(CCNB1)、透明质酸介导的运动受体(HMMR)、微小染色体维持蛋白10(MCM10)、母系胚胎亮氨酸拉链激酶(MELK)为NSCLC预后的危险因素。结论 CCNB1、HMMR、MCM10、MELK可作为NSCLC预后的潜在生物标志物,为进一步研究NSCLC提供新思路。

  • 单位
    恩施土家族苗族自治州中心医院