摘要

目的肺癌是世界上发病率和致死率最高的恶性肿瘤,肺腺癌(LUAD)目前已成为肺癌中最主要的病理类型,占所有肺癌患者的80%-85%。本研究应用生物信息学技术,探究肺腺癌潜在的关键基因,最终服务于肺腺癌的诊断、治疗及预后判断。方法从基因表达综合数据库获取到三个包含肺腺癌及正常组织样本的数据集(GSE33532、GSE40791、GSE19188),应用R软件的Limma包筛选出DEGs。使用DAVID数据库对DEGs进行GO及KEGG富集分析,应用STRING及Cytoscape等工具对DEGs构建蛋白相互作用网络,并筛选出hub genes,应用生存曲线及GEPIA对hub genes进行校验及分析。结果共筛选出1354个DEGs,构建出的PPI模型共包含817个节点和5557条连线,并选出三个核心模块,及八个hub genes,包括CDK1、CDC20、CCNA2、CCNB1、BUB1、CCNB2、TOP2A及AURKB,它们都与较差的肺癌预后相关。结论本研究通过生物信息学分析确定了CDK1、CDC20、CCNA2、CCNB1、BUB1、CCNB2、TOP2A及AURKB可能对肺腺癌的发展和预后存在一定影响,可以作为肺腺癌的潜在生物标记物。