摘要

Hadoop是一款能够对海量数据进行分布式处理的软件框架,它是一款可靠的、分布式的、开源的、可伸缩的框架,Hadoop2.x主要分为四大部分:Common,MapReduce,HDFS,Yarn,本文就MapReduce的入门程序WordCount进行分析,探究MapReduce的工作流程及原理。