癌症基因组图谱(TCGA)是一个具有里程碑意义的癌症基因组计划,它从分子上表征了32000多个原发癌症样本,分别归属于39种癌型及其亚型,且具有对应病人的正常细胞样本。本文主要从基因表达谱分析流程出发,针对Broad GDAC Firehose数据库中来自TCGA数据库的1098套乳腺癌、631套结直肠腺癌、551套肺腺癌基因表达谱数据,挖掘原发肿瘤和转移瘤的特征表达谱及其对应的生物学功能。