摘要
目的:应用生物信息学方法筛选胰腺导管腺癌的预后风险长链非编码RNA(lncRNA)。方法:从癌症和肿瘤基因图谱(TCGA)数据库下载胰腺导管腺癌患者的RNA-seq Level 2数据及其临床信息。根据NCBI Gene数据库及GENCODE v7数据库的基因注释信息,将下载的mRNA和lncRNA测序数据进行重新注释。然后应用R软件的edgeR包和limma包筛选差异表达的mRNA和lncRNA,并对它们进行相关性分析,进而获得lncRNA-mRNA有统计学意义的共表达关系对,并将其中的mRNA定义为lncRNA的靶基因。通过R软件clusterProfiler包对lncRNA的靶基因进行功能富集分析,以推测lncRNA的生物学功能。最后,绘制差异表达lncRNA的Kaplan-Meier曲线,筛选出与胰腺导管腺癌预后风险相关的lncRNA。结果:经过基因重新注释,共得到19 791个mRNA和1 623个lncRNA的测序数据,随后共筛选得到260个差异表达的mRNA和15个差异表达的lncRNA。经过相关性分析,共得到包括5个lncRNA和24个mRNA在内的24个有统计学意义的共表达关系对。其中lncRNA LINC00857有6个靶基因,分别为C1orf116、ESRP1、GPRC5A、LIPH、MAL2和PLS1。根据lncRNA靶基因的功能富集分析,推测LINC00857主要富集于磷脂酶活性、细胞骨架结构组成和脂肪酶活性。生存分析发现,CASC8和LINC00857与胰腺导管腺癌的预后风险明显有关(P=0.0052、P=0.027)。结论:CASC8和LINC00857可能是胰腺导管腺癌的预后风险lncRNA,有望在今后的研究中成为胰腺导管腺癌新的预后监测指标。
- 单位