摘要

面对数据量的不多增大真多,单台主机已不能够满足计算与存储的需求,所以,目前主要使用分布式的计算与存储方式去分析处理这些大量的数据,并从中挖掘潜在的价值。其中,Hadoop平台是使用最多的一种开源式计算与存储框架。本文首先介绍Hadoop平台的构架与原理,然后介绍基于Hadoop平台的大数据分析处理技术,最后介绍Hadoop平台的性能优化。可见,Hadoop平台在大数据中应用的优势。