摘要

在数据类型不断增加,规模逐渐扩大的趋势下,No SQL技术与Map Reduce并行处理理念开始备受关注。而作为No SQL数据库典型代表,MongoDB可索引并查询大量数据,但是其所提供的Map Reduce无法满足太过繁杂的数据分析与并行计算。而Hadoop具备强大的Map Reduce计算能力,但实时服务延时较长。对此,可基于扩展性、数据本地化等相关要素分析,整合Hadoop与MongoDB,针对不同应用场景,寻求最优整合方式,以提高大数据处理效率与质量。