GEO数据库架构、申请及数据提取方法与流程

作者:闫小妮; 田国祥; 郭晓娟; 李豹; 张军; 吕军*
来源:中国循证心血管医学杂志, 2019, 11(02): 134-137.

摘要

基因表达综合数据库(Gene Expression Omnibus),简称GEO数据库,由美国生物技术信息中心(NCBI)开发的一个完全公开的高通量基因分子丰度数据库,是一个公共功能基因组数据存储库,接受基于数组和序列的数据。该数据库主要储存基因表达数据,涵盖多个生物学领域的高通量实验数据,其提供工具帮助用户查询和下载实验和管理基因表达谱,为生物信息学研究提供了大量与疾病相关的基因表达谱信息。研究者通过对基因芯片提供的大量基因表达谱数据信息的深度挖掘和分析,有助于了解基因的功能以及基因间的相互作用关系,解读基因表达的代谢过程,分析基因的遗传特征和功能,研究疾病的发生发展规律,为疾病的诊断与治疗提供科学参考。本文旨在介绍GEO数据库的架构、申请方式及公开数据的提取方法。

  • 单位
    西安交通大学; 西安交通大学第一附属医院; 公共卫生学院; 神经内科; 解放军总医院