摘要
在多智能体系统中,由于智能体数量规模庞大,博弈关系复杂,给策略学习带来了很大的困难,所以学会在智能体之间进行良好的通信十分重要,提出了一个策略网络模型(Attentional Interactions Communication Comment Integration Network, AICNet)提高通信效率。具体来说,AICNet采用了两个模块。第一个注意力模块可以学习智能体之间随时间变化的注意力并更新智能体之间的交互影响;另一个聚合的通信模块可以同步智能体的通信信息。通过将AICNet应用于两组不同的协作与混合性质的模拟实验,以训练的平均奖励和收敛速度为指标,结果表明AICNet的表现优于对比算法,且在模拟环境中观察到智能体确实可以根据彼此关注度自动分组进行任务。
- 单位