摘要
【目的】通过预测歌单播放量并探究影响播放量的因素,帮助甄别歌单的优劣,方便在线音乐平台对歌单质量进行把关。【方法】利用爬虫获取网易云音乐歌单的数值特征和文本特征,采用Word2Vec和BERT对文本进行预训练,然后分别建立RF、XGBoost、DNN模型对歌单播放量进行多组预测对照实验。【结果】DNN模型的预测准确率要高于RF和XGBoost模型,歌单的初始播放量、评论、收藏、转发数对播放量的影响最为显著,而文本特征会使预测准确率下降。【局限】受到网易云音乐歌单推荐每日更新这一不可控因素的影响,只获取了歌单12h后的播放量数据。【结论】通过构建播放量预测模型,可以帮助在线音乐网站对歌单优劣进行初步判断。
- 单位