摘要

目的:生物信息学方法建立全面的肝细胞癌(HCC)差异表达基因谱以及初步筛选基于该恶性肿瘤样本的特征基因。方法:利用R语言中的edgeR包分析不同组之间差异表达的基因(DEGs)。利用STRING数据库分析预测蛋白质的功能联系和蛋白质相互作用。R语言的clusterProfiler包做GO(gene ontology)(包括biological process、molecular function和cellular component)及KEGG(kyoto encyclopedia of genes and genomes)通路富集分析。筛选差异基因显著富集的GO和KEGG分子途径。利用SLC7A11(solute carrier family 7 member 11)和CCDC14(coiled-coil domain-containing 14)基因作为肝细胞癌的标志物,利用ELISA法进行检测(确诊的HCC阳性患者为HCC组,共195例;HCC阴性正常人群为对照组,共107名),计算阳性率。结果:与癌旁对照样本相比,一共鉴定出454个差异表达基因,其中高表达基因234个,低表达基因220个。PPI方法进一步筛选出排名前10的重要潜在基因,其中SLC7A11和CCDC14两个基因排名靠前。利用富集分析,差异基因主要集中在neuroactive ligand-receptor interaction通路中。与对照组相比,HCC组SLC7A11和CCDC14存在显著的高表达[SLC7A11:(70.12±14.3)ng/mL比(23.12±7.11)ng/mL,t=6.17,P<0.001;CCDC14:(6.17±2.31)pg/mL比(2.13±0.84)pg/mL,t=5.35,P<0.001]。SLC7A11针对HCC检测阳性率达到80.2%,而CCDC14达到68.8%。结论:SLC7A11和CCDC14可以作为HCC的两个潜在的有效临床生物标志物。