基于离散MADDPG的边缘缓存决策模型、方法和系统

作者:魏振春; 傅宇; 吕增威; 张本宏; 樊玉琦; 石雷; 徐娟
来源:2022-05-27, 中国, ZL202210586227.3.

摘要

基于离散MADDPG的边缘缓存决策模型、方法和系统,所述边缘缓存决策模型适用于用户终端、云服务器和多个RSU组成的通信网络;所述边缘缓存决策模型基于神经网络构建,其与RSU一一对应,所述边缘缓存决策模型用于根据RSU的状态生成对应的动作决策。本发明将多智能体深度强化学习中的离散MADDPG算法引入协作边缘缓存,能够实现智能体间的合作通信且有强大的决策能力,可以很好地实现缓存决策且控制缓存冗余。