本文搭建了一个基于虚拟机网络的hadoop云计算环境,对日志数据KPI指标的计算及处理分析,获取该批日志数据浏览器访问者来源信息,通过对结果按数量排序获得该应用的最活跃的访问者情况。该系统的实现算法不但能处理日志数据,还可以对格式化的文本大数据进行处理。