Hadoop是一个分布式开源计算平台,它以分布式文件系统HDFS和Map Reduce为核心,为用户提供系统底层细节透明的分布式基础架构。HDFS为分布式文件系统提供存储环境,而MapReduce为分布式数据提供运算环境。其特点是高可靠性、高扩展性、高效性、高容错性。