在信息时代下,网络中每天都会有大规模移动流量数据产生。采用面向海量数据处理的高效、可靠的分布式并行计算成为互联网行业和各大营运商研究重点。文章阐述了移动流量数据监测方法和意义,重点对基于图谱分析的网络流量数据分析与识别算法进行研究。对于网页请求间的相互关系分析,采用基于依赖图模型的用户点击识别算法;对于网络实体间的关系结构分析,设计了并行tNMF算法;为对大规模移动网络流量进行精细化分析,提出了基于Spark计算框架的并行快速流式算法。