摘要
目的:利用生物信息学方法分析非小细胞肺癌(NSCLC)基因表达谱芯片,筛选相关差异基因,寻找NSCLC潜在的生物标志物。方法:从GEO数据库下载NSCLC相关芯片数据(GSE1987、GSE44077)及TCGA数据库中NSCLC数据,利用Funrich软件对差异基因进行相关功能及通路富集分析,并用STRING数据库对蛋白质-蛋白质相互作用(PPI)网络分析,筛选出核心基因。然后,使用在线工具对核心基因进行组织表达、细胞表达及预后分析。结果:共筛选出7个共同上调表达的基因分别是:重组人分泌型磷蛋白1(SPP1)、SPINK1、母体胚胎亮氨酸拉链激酶(MELK)、谷胱甘肽过氧化酶2(GPX2)、CYP24A1、TFAP2、ETV4,主要参与血管内皮生长因子(VEGF)、PI3K、mTOR、ErbB受体、TNF、信号转导、凋亡等信号通路,主要参与细胞凋亡、蛋白质代谢、信号转导、细胞生长等生物学过程。MELK在肺组织及肺癌细胞系中相对高表达,Kaplan-Meier Plotter分析提示其是NSCLC预后的危险因素。结论:MELK可能成为NSCLC预后的潜在生物标志物,对其生物学作用的进一步研究有利于揭示NSCLC的具体发病机制以及提供新的潜在治疗靶点。