基于Hadoop的数据分析系统设计

作者:贠佩; 晁玉蓉; 樊华; 崔超飞; 陈伟*
来源:数字技术与应用, 2019, 37(03): 182.
DOI:10.19695/j.cnki.cn12-1369.2019.03.96

摘要

Hadoop是一个分布式开源计算平台,它以分布式文件系统HDFS和Map Reduce为核心,为用户提供系统底层细节透明的分布式基础架构。HDFS为分布式文件系统提供存储环境,而MapReduce为分布式数据提供运算环境。其特点是高可靠性、高扩展性、高效性、高容错性。

全文