摘要
目的探讨甲胎蛋白(AFP)高表达和低表达肝细胞肝癌(HCC)中的差异表达基因表达谱, 为HCC的分子机制研究及预后判断提供理论依据。方法从肿瘤基因图谱计划(TCGA)公共数据库获得368例包含完整临床信息的HCC转录组数据, 根据组织AFP mRNA表达四分位数将样本分为AFP高表达组和AFP低表达组, 每组各92例。应用R软件中的DEseq2包进行差异表达基因分析, 应用ClusterProfiler包对差异表达基因进行基因本体论(GO)功能分析和京都基因与基因组百科全书(KEGG)通路分析, 应用String数据库和Cytoscape软件构建蛋白相互作用网络, 筛选关键基因。采用单样本基因集富集分析方法, 通过R软件GSVA包对特征基因进行富集评分, 根据得分定义特征基因集表达情况。利用RNAseq数据和实时荧光定量聚合酶链反应(RT-qPCR)进行独立数据集验证和组织验证。结果 TCGA数据分析显示, AFP高表达与HCC低分化、患者人种有关(均P<0.05)。生物信息学分析共获得1 382个差异表达基因, 其中931个基因在AFP高表达组织中表达上调, 451个基因表达下调。GO功能分析显示, AFP高表达组织中高表达的基因主要与附属肢体发育、肢体发育、骨架系统发育等过程有关, 而低表达基因则与异源物代谢、类固醇代谢、细胞对异生物刺激反应等代谢相关过程有关。KEGG通路分析显示, AFP高表达组织中高表达的基因主要参与原发性免疫缺陷、神经活性配体-受体相互作用、细胞因子-细胞因子受体相互作用通路, 而低表达基因主要与视黄醇代谢、化学致癌作用、类固醇激素的生物合成等通路相关。鉴定出1个预后相关特征基因集, 该基因集包括AURKB、TTK、CENPA、UBE2C、HJURP、KIF15, 其高表达与HCC患者的无复发生存和总生存有关, 且特征基因集富集分数与AFP表达呈正相关(r=0.475, P<0.001)。RNAseq数据验证结果与TCGA数据分析结果基本一致。RT-qPCR检测结果显示, 特征基因集中AURKB、KIF15和UBE2C在AFP高表达HCC组织中显著高表达, 其表达虽然与HCC患者的无病生存、总生存无关, 但AFP低表达组患者的无病生存曲线和总生存曲线均在AFP高表达组患者之上。结论 AFP高表达和AFP低表达HCC在基因表达谱上存在较大差异。筛选出的特征基因集可能协同AFP共同促进HCC的发生发展, 其对解释不同水平AFP HCC的作用机制有一定作用, 并为HCC的预后判断提供了新的思路和依据。
-
单位中国医学科学院北京协和医学院; 分子肿瘤学国家重点实验室