摘要
目的:通过对癌症基因组图谱(TCGA)数据库中大样本结直肠癌组织基因表达谱RNA测序(RNA-Seq)数据进行生物信息学分析,挖掘与结直肠癌预后密切相关的新基因,并对筛选出的新基因进行验证和功能研究。方法:从TCGA数据库下载结直肠癌RNA-Seq数据筛选差异表达基因,采用R-survival包对差异表达基因进行生存分析,筛选出与结直肠癌预后相关的基因,并从中挑选尚未在肿瘤研究中报道的表达上调最显著的新基因进行验证。采用RT-qPCR检测新基因在人结肠癌细胞、人正常结肠上皮细胞、人结直肠癌组织及配对的癌旁组织中表达水平的变化。采用慢病毒载体构建稳定沉默新基因表达的结肠癌细胞,以转染阴性对照慢病毒的结肠癌细胞为对照,采用CCK-8和Transwell实验研究稳定沉默新基因表达对结肠癌细胞活力、迁移和侵袭的影响。结果:(1)筛选出结直肠癌差异表达基因4 017个,Kaplan-Meier生存分析显示69个基因与结直肠癌患者预后差密切相关(P<0. 01),其中表达上调基因36个,这36个基因中有11个尚未在肿瘤研究中被报道。(2)表达上调倍数前3位的基因为CCDC78、PGGHG及TSPEAR,这3个基因的mRNA表达水平在结肠癌细胞中显著上调(P<0. 01),CCDC78 mRNA表达水平在结直肠癌组织中也显著上调(P<0. 01)。(3)稳定沉默CCDC78表达可显著抑制结肠癌细胞活力、迁移和侵袭(P<0. 01)。结论:基于TCGA数据库的生物信息学分析有助于发现与结直肠癌预后相关的新基因;CCDC78可能是一个新的与结直肠癌预后差相关的癌基因。
- 单位