摘要

协同过滤算法被大规模用于推荐系统中,随着信息技术进入一个新的高度,传统的推荐技术在提高用户的推荐准确率和推荐时效性方面均存在缺陷。针对这两个问题,提出了一种基于用户行为概率的协同过滤方法。根据Spark可以将中间结果存于内存的优点,将该方法基于Spark框架进行并行化设计,实现分布式计算。算法采用Movie Lens等数据集进行测试。结果表明,分布式设计的方案在准确率和效率方面均有提升。

全文