摘要

针对Hadoop集群部署和维护的复杂性,分析了手工部署和工具部署各自的优缺点,提出了基于Ambari平台的快速安装部署一套Hadoop3.x分布式集群实践方案,并讨论了自动化部署要点及步骤。基于Ambari工具完成了Hadoop生态圈HDFS、Zookeeper、HBase、Hive等组件安装部署后,进行应用环境性能测试。实践结果表明,相比较于传统手工>24 h部署,基于Ambari快速部署可以在<5 h内轻松完成,大大提高了集群部署的时间效率及成功率,极大方便大数据教学以及大数据用户行为分析平台、大数据推荐系统和大数据仓库平台等各种业务生产环境部署。