摘要

目的:采用生物信息学方法筛选影响肺腺癌(LUAD)的关键基因,分析其生物学功能及其对LUAD预后的影响。方法:于高通量基因表达(GEO)数据库下载GSE118370和GSE136043芯片数据,癌症基因组图谱(TCGA)数据库筛选LUAD相关数据。采用R软件分析共同表达的差异表达基因(DEGs)。采用clusterProfile R包对DEGs进行基因本体(GO)功能富集分析,DAVID数据库进行京都基因与基因组百科全书(KEGG)通路富集分析,STRING数据库构建蛋白-蛋白相互作用(PPI)网络。采用Cytoscape筛选连接度排名前10位的关键基因,GEPIA数据库和人类蛋白质图谱(HPA)数据库分析正常肺组织和LUAD组织中关键基因mRNA和蛋白表达情况及不同分期LUAD组织中关键基因表达情况。关键基因免疫浸润分析和生存分析获取关键基因表达与患者生存期的相关关系。结果:共筛选DEGs 428个。GO分析,LUAD的DEGs在主要富集于上皮-间质转化(EMT)等生物过程(BP)方面、细胞基部等细胞组分(CC)方面和细胞外基质(ECM)结构形成等分子功能(MF)方面。KEGG分析,LUAD的DEGs主要富集于细胞因子受体相互作用通路等方面。筛选DNA拓扑异构酶Ⅱα (TOP2A)、果蝇纺锤体异常基因(ASPM)、细胞周期蛋白B1(CCNB1)、人类细胞分裂周期相关基因8 (CDCA8)、含杆状病毒IAP重复序列蛋白5 (BIRC5)、苏氨酸激酶(AURKA)、驱动蛋白超家族成员20A (KIF20A)、中心体相关蛋白55 (CEP55)、着丝粒蛋白F (CENPF)和微管组织因子(TPX2)为关键基因。与正常肺组织比较,LUAD患者肺组织中TOP2A、CCNB1、CDCA8、BIRC5、AURKA、KIF20A、CEP55、CENPF和TPX2 mRNA表达水平均增加(P<0.01),蛋白表达均增加。CCNB1、CDCA8、BIRC5、AURKA、KIF20A、CEP55和TPX2 mRNA在不同LUAD分期的表达水平差异均有统计学意义(P<0.01)。与Ⅰ、Ⅱ和Ⅲ期LUAD患者比较,Ⅳ期LUAD患者肺组织中CCNB1、 CDCA8、 AURKA、 KIF20A、 CEP55和TPX2 mRNA表达水平增加(P<0.01);与Ⅰ、Ⅱ和Ⅳ期LUAD患者比较,Ⅲ期LUAD患者肺组织中BIRC5 mRNA表达水平增加(P<0.01)。10个关键基因表达与B淋巴细胞浸润均呈负相关关系(-0.253≤r≤-0.014,P<0.01);TOP2A、ASPM、CDCA8、BIRC5、CEP55、CENPF和TPX2表达与中性粒细胞浸润呈正相关关系(0.049≤r≤0.165,P<0.01);CCNB1和AURKA表达与CD4 T淋巴细胞、巨噬细胞和树突状细胞浸润呈负相关关系(-0.210≤r≤-0.100,P<0.01)。CDCA8高表达会增加LUAD恶化风险(P<0.01),TOP2A、CCNB1、CDCA8、BIRC5、AURKA、KIF20A、 CEP55、 CENPF和TPX2高表达会增加患者死亡风险(P<0.01)。结论:TOP2A、ASPM、 CCNB1、 CDCA8、 BIRC5、 AURKA、 KIF20A、 CEP55、 CENPF和TPX2是参与LUAD发生进展过程的关键基因,可能通过加速EMT过程促进LUAD发展,其高表达提示LUAD患者预后不良和死亡风险升高。

全文