摘要

为了解决全景视频服务中云服务器和边缘服务器的联合边缘缓存所面临的问题,优化边缘缓存机制,降低用户获取视频资源的时延,提出一种基于深度Q学习(DQN)算法的视频资源缓存策略生成方法。针对当前全景视频中存在的多比特率版本,考虑了边缘缓存内容和不同比特率版本间的转码时延,以节约总时间为目标,通过将问题建模为马尔可夫决策过程,结合模型中数据离散的特性,采用DQN算法训练模型,并在迭代过程中获得最优缓存策略。仿真结果表明,所提算法的收敛速度较快,具有最优的性能。此外,在约束条件发生变化时,用所提算法能自行调整边缘缓存策略,使其性能稳定提升,为全景视频边缘缓存机制提供了切实可行的方案。

全文