摘要
论文首先介绍了数据仓库的基本概念,作为基于Hadoop的数据仓库工具,Hive将结构化的数据文件映射为一张数据表,通过类SQL查询功能的HiveQL语言可以对数据表进行查询操作,本质是将HiveQL语句转换为MapReduce任务进行并行计算,而不用在进行编程实现查询功能。其次,对Hive数据仓库与结构化数据库系统的不同进行了对比以及转换为MapRedue的过程。最后,进行实践操作,表明数据仓库工具Hive操作优越性并将数据导出进行可视化呈现。
-
单位防灾科技学院