在信息技术飞速发展的今天,如何从每天产生的海量数据中提取符合要求的数据,这就需要用到云计算技术。Hadoop作为一个分布式的开源平台无疑是最好的选择。本文重点阐述了完全分布式Hadoop平台的搭建过程。结果表明,Hadoop平台可以很好地完成大规模数据的分布式并行处理任务。