摘要
大数据时代,互联网及其产品已融入各行各业,人们开始通过互联网来获取更多的机遇和有价值的信息。与此同时,通过网络传播信息可以显著提高工作效率,有效降低成本。传统的Hadoop具有速度慢、算子少等缺点,而Spark是一种用于处理海量数据的通用高速分布式计算框架。同时,Spark计算框架附带了机器学习库,可以为后续用户行为、日志挖掘分析提供技术支持。本文首先讨论了日志或用户行为分析的意义,其次,本文简要介绍了网站用户行为分析系统的设计思路及具体实现,再次对系统应用场景及创新性进行了概括说明,最后,本文对系统产业价值进行了展望。
-
单位四川长虹电子控股集团有限公司