摘要

GEPIA(Gene Expression Profiling Interactive Analysis)即基因表达谱数据动态分析,是一个由中国人新开发的用于癌症和正常基因表达谱分析的公共数据库,填补了癌症基因组学大数据信息的缺口。GEPIA分析来自TCGA和GTEx项目的9736个肿瘤和8587个正常样本的RNA测序表达数据,TCGA和GTEx的表达量数据都是在同一个pipeline下重新算出来的,可以直接进行非常全面的表达分析。该数据库是一个开放的公共数据库,感兴趣的研究者可以申请其中的数据进行相关研究,本文旨在对GEPIA数据库的架构以及基因数据的提取、分析、结果表达制图方法进行介绍。

  • 单位
    解放军总医院; 西安交通大学第一附属医院; 西安交通大学; 公共卫生学院