摘要

目的:利用生物信息学方法分析胰腺导管腺癌(PDAC)基因表达谱芯片并筛选关键基因。方法:从公共数据库基因表达数据库(GEO)中下载PDAC基因表达谱芯片GSE28735、GSE15471、GSE101448,共纳入108例PDAC样本和97例癌旁组织样本。应用R语言limma包和impute包筛选差异表达基因。利用DAVID数据库和在线分析工具Kobas分别对差异基因进行GO功能富集分析和KEGG通路富集分析。利用STRING数据库和Cytoscape软件构建差异蛋白互作网络并进一步筛选关键基因。结果:3个基因表达谱芯片共有161个差异表达基因(|log2 fold-change(FC)|>2,P<0.05),包括54个上调基因,107个下调基因。GO功能富集分析显示差异基因与extracellular exosome、extracellular space、extracellular matrix organization密切相关。KEGG通路分析显示差异基因主要富集在protein digestion and absorption、ECM-receptor interaction和focal adhesion等通路。蛋白质相互作用网络图中显示节点最多的10个枢纽基因分别是ALB、COL11A1、COL3A1、FN1、EGF、COL1A1、MMP9、COL5A2、ITGA2、COL6A3。结论:筛选所得的10个关键基因可能在PDAC发生发展中发挥重要作用,有望成为PDAC诊断及治疗的生物学靶标,为进一步研究PDAC发生发展的分子机制提供了理论依据。