基于Hadoop的交互式大数据分析查询处理方法

李聪颖; 王瑞刚; 梁小江

摘要

基于Hadoop的交互式大数据分析查询处理方法旨在快速分析查询大数据集的信息,最重要的特征就是查询速度快。该方法能够运行在上千节点的集群上,适于半结构化/嵌套数据的分析、兼容现有的SQL环境和Apache Hive。文中主要利用此方法实现连接HDFS、Hive以及Hbase进行查询测试,还完成了同时从不同数据源上关联查询数据。在同一Hadoop集群环境中,将该方法与Spark SQL对于10万、20万、50万、100万、500万条数据进行查询速度对比测试。经过多次实验后得出,基于Hadoop的交互式大数据分析查询处理方法速度快、效率高,能够帮助企业用户快速、高效地进行Hadoop数据查询和企业...

单位
陕西省信息化工程研究院; 西安邮电大学

收藏分享被引浏览

更新时间：2019-06-26 19:24

基于Hadoop的交互式大数据分析查询处理方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友