摘要
【目的】利用多模态特征融合和深度强化学习缓解数据稀疏性和用户兴趣偏好动态变化问题。【方法】使用预训练模型和注意力机制分别实现模态内表征和三模态间融合,同时建模用户-项目交互,并利用深度强化学习算法实时捕捉用户兴趣漂移和长短期奖励实现个性化推荐。【结果】较对比模型中最高值,所提模型在MovieLens-1M、MovieLens-100K和Douban数据集上的Precision@5分别提高11.8%、16.5%和11.4%,NDCG@5分别提高5.3%、8.0%和6.4%。【局限】Douban数据集的用户交互历史较少,所提模型在训练过程中无法学习到更准确的用户偏好,与在MovieLens数据集上的实验相比,推荐结果受限。【结论】所提模型融合项目多模态信息重构深度强化学习的状态表示网络,改善了推荐效果。
- 单位