摘要
【目的】探索在导入、保存、检索、批量导出生物医学大数据方面的新思路和新方法,积累第一手经验。【方法】分析生物医学大数据的特点,从理论方面和数据查询对比实验两个方面,对比分析以Oracle为代表的传统关系数据库和以HBase为代表的No SQL数据库在解决大数据问题时各自采用的技术以及各自的优势与不足。以一个药物基因组数据存储系统为例,进行云存储实践和初步的对比实验。【结果】HBase在处理大量数据的实际应用中,比Oracle更具优势。【局限】没有对药物基因组学数据进行深入挖掘分析,同时需要对Hadoop/HBase做深入的技术优化。【结论】HBase在本文实验的应用场景中能够满足生物医学大数据存储的要求。
-
单位中国医学科学院医学信息研究所