摘要
目的:采用生物信息学方法分析结直肠癌(colorectal cancer, CRC)在转录组中的差异基因,建立基因互作网络,以期筛选出关键基因并探索其发病机制。方法:从TCGA数据库下载CRC转录组数据集,采用edgeR包筛选其差异基因。使用DAVID数据库对差异基因进行GO功能和KEGG通路富集分析。通过STRING数据库分析蛋白质互作网络,运用Cytoscape进行关键子网提取并构建KEGG通路-基因互作网络,最后结合生存分析等筛选并验证CRC潜在生物标志物。结果:对转录组数据集分析筛选出5 037个差异基因,其中上调基因1 571个、下调基因3 466个,从5 037个差异基因中提取到1 781个lncRNA。GO富集分析表明CRC的差异基因主要富集在钙离子结合、受体结合及结构分子活性等功能。KEGG富集分析表明其主要参与神经活性配体-受体相互作用和药物代谢-细胞色素p450等通路。使用Cytoscape软件提取出6个关键子网,通过各互作网络共筛选出288个关键基因,结合Kaplan Meier预后分析最终筛选发现67个CRC潜在调控基因(其中已有报道证实22个mRNA和7个lncRNA)具有预后价值,并采用ONCOMINE数据库进行了CRC临床样本验证。结论:本研究筛选出的67个潜在调控基因可作为CRC潜在生物标志物,为研究者创新CRC药物及治疗方案提供了新思路。
-
单位河北工业大学廊坊分校; 河北工业大学