基于Spark平台ALS模型推荐算法的研究

作者:吴青洋; 程旭; 邓程鹏; 丁浩轩; 张宏; 郑志伟
来源:电脑知识与技术, 2018, 14(23): 33-36.
DOI:10.14004/j.cnki.ckt.2018.2540

摘要

针对推荐系统的可扩性问题,该文比较了基于Hadoop实现ALS模型推荐算法与基于Spark平台实现ALS模型推荐算法的性能,通过在GroupLens网站提供的MovieLens数据集上的实验结果表明,Spark平台的计算性能更强。针对推荐系统的数据稀疏性问题,该文采用了ALS模型推荐算法。最后在Spark平台上使用Scala编程语言,对不同参数下的ALS模型进行训练,并在校验集中验证,获取了最佳参数下的模型。

全文