摘要

以2011—2018年期间票房过亿的293部国产电影为样本,利用网络爬虫技术,从电影票房网、时光网、艺恩网、猫眼网以及微博选取电影观众评分人数、首日票房、首周票房、观众想看人数、明星的影响力、导演的影响力、编剧的影响力、制式、电影评分等因素为变量,选择其中的30部电影为测试集,263部电影为训练集,基于随机森林回归的方法,建立电影票房预测模型。研究结果表明,电影票房平均预测精度在85%左右。