摘要

为了能够更好的对尚未上映的电影进行客观评分,供观众进行参考和向观众推荐高质量电影,以豆瓣电影网的数据作为研究对象,从电影的导演、编剧、主演、类型、国家地区等5个维度构建电影的特征向量,基于Spark MLlib机器学习框架,通过随机森林回归算法构建电影评分预测模型。最后,在真实的电影数据集上进行验证,结果表明本模型预测评分确定系数达到0.75,可以有效地预测出电影的评分。

  • 单位
    中国电子科技集团第二十八研究所