摘要
目的:通过生物信息学方法挖掘非小细胞肺癌(NSCLC)基因表达谱芯片数据,筛选并验证与NSCLC发生和预后相关的关键基因。方法:从Gene Expression Omnibus(GEO)数据库中下载芯片数据(GSE101929和GSE27262)。采用GEO2R在线工具筛选癌组织和癌旁组织中的差异表达基因(DEGs);采用DAVID在线工具对差异表达基因进行GO和KEGG信号通路分析并用Cytoscape和FunRich软件进行可视化;采用GEPIA在线工具对差异表达基因进行验证和预后分析。结果:共筛选出1 816个差异表达基因,其中上调基因数651个,下调基因数1 165个。上调基因主要富集在"基质金属肽酶活性",下调基因主要富集在"受体活性"等分子功能。KEGG信号通路分析显示上调基因主要富集在"有丝分裂前中期"等信号通路,而下调基因主要富集在"上皮-间质转化"信号通路。蛋白-蛋白交互作用(PPI)分析显示,上调基因中的前五位为TOP2A、CDK1、CCNB1、CCNA2和KIF11,而下调基因中的前五位为IL6、FGF2、LRRK2、EDN1和IL1B。总生存率分析显示,KIF11低表达与NSCLC预后呈负相关。结论:本研究鉴定出了与NSCLC相关的关键基因,有望作为NSCLC患者潜在治疗靶点或预后判断相关的生物标志。