摘要

目的早期诊断和精准靶向治疗是提高乳腺癌治愈率、降低死亡率的有效途径。本研究旨在通过生物信息学方法,分析癌症基因组图谱(the Cancer Genome Atlas,TCGA)数据库中人类乳腺癌不同临床病理分期的癌组织与癌旁组织基因之间的差异,获得不同临床病理分期相关特异性标志基因,为乳腺癌不同临床病理分期的分子诊断及靶向治疗方案的确定提供参考。方法 TCGA数据库中IlluminaHiSeqRNASeqV2平台下临床样本数据集中的722个乳腺癌转移基因组数据,对临床病理分期Ⅰ、Ⅱ、Ⅲ和Ⅳ阶段的癌组织与癌旁组织基因之间的差异表达进行分析,以基因差异表达绝对值相差5倍作为候选标准进行分析,选择其中|log2FC|≥2.5且P≤0.05的基因进行差异表达基因分析,获得差异表达基因谱。将得到的差异表达基因进一步通过Enrichr与Kobas网站工具分别进行基因本体(gene ontology,GO)功能注释和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,确定差异表达基因的功能及作用通路。利用Targetscan和Mirwalk等工具构建与靶基因相关联的miRNA,建立临床病理分期各阶段关联表达的miRNA图谱。Cytoscape软件建立乳腺癌临床病理分期的基因表达与相应miRNA相关性图谱。结果共获得乳腺癌癌组织和癌旁组织差异表达基因112个,其中癌组织高表达的基因有34个,癌旁组织高表达基因有78个。各阶段的特异性差异表达基因Ⅰ期5个、Ⅱ期4个、Ⅲ期2个和Ⅳ期13个,其中各阶段上调基因Ⅰ期4个、Ⅱ期0、Ⅲ期0和Ⅳ期4个,下调基因Ⅰ期1个、Ⅱ期4个、Ⅲ期2个和Ⅳ期9个。GO富集分析显示,各阶段特异性差异表达基因主要包括与癌细胞外基质组织、细胞周期的调控基因、蛋白质磷酸化调控、细胞增殖的调节、染色体功能、细胞膜完整性、金属内肽酶活性、蛋白激酶结合性、半胱氨酸型内肽酶抑制活性及细胞因子活性相关。KEGG通路富集分析显示,癌组织差异表达基因显著富集在癌症通路、细胞因子受体相互作用通路、卵母细胞减数分裂通路与细胞周期通路中。miRNA靶向的反向通路富集中,建立miRNA与mRNA共同作用的各阶段特异性通路,获得mRNA高表达与相应的miRNA低表达相关的临床病理分期基因表达差异图谱。结论通过分析TCGA乳腺癌癌组织与癌旁组织基因表达差异,获得了临床病理Ⅰ、Ⅱ、Ⅲ和Ⅳ期特异性标志基因,并通过GO聚类分析和KEGG通路富集分析,获得了病理分期各阶段在细胞增殖、浸润、分化、定向转移与扩散等分子过程的差异。本研究为乳腺癌临床各阶段的诊断和精准靶向治疗提供了依据,为进一步了解乳腺癌各阶段的分子机制提供了新的信息。

全文