摘要

<正>数据处理及存储过程中采用了分布式架构,其中有HDFS和Map Reduce两项关键技术。近两年,通信流量业务开展得如火如荼,用户上网行为的数据分析需求随之猛增,而处理这类数据需要大量的写入处理,而且字段不固定,传统的关系型数据库已无法满足需求,急需多节点的分布式大数据集群来解决数据存储及处理问题。本研究构建了一套大数据采集、存储

全文