协同过滤推荐技术作为推荐系统的一个重要分支,成为目前应用最广泛的一种推荐算法。但协同过滤算法仍然显露出数据稀疏性问题、可扩展性问题等。为解决上述问题,文章提出了基于Spark平台的基于ALS算法和物品相似度相结合的混合协同过滤算法。本文算法在一定程度上解决了因数据量不足带来的数据稀疏性问题,基于Spark分布式并行计算框架技术也解决了可扩展性问题,同时又提高了算法推荐的准确性。基于Movielens数据集的实验表明,文章算法具有可扩展性高、响应时间短以及推荐精度高等特点。