结合联邦学习和强化学习的事物资源信息分配方法及系统

作者:董学文; 游志超; 张文; 李麒麟; 沈玉龙; 底子杰; 强洁丹; 郭校杰
来源:2020-12-25, 中国, ZL202011568601.4.

摘要

本发明属于深度学习技术领域,公开了一种结合联邦学习和强化学习的事物资源信息分配方法及系统,需要待分配事物的需求个体有多个,他们需要待分配事物来满足自己的利益或要求,个体带有一定计算能力以及通信能力的设备;该事物的管理和分配由管理者进行统一分配,且该事物并不能在数量上同时满足所有个体;管理者设计深度强化学习模型,并分发给每一个个体,个体使用该模型对事物进行选择;管理者通过联邦学习产生新的全局模型。本发明在事物拥有大量的个体来训练。即使每一个个体都进行了非常小量的训练,其最后产生的模型仍然适用于绝大部分的个体。可以将训练安排给空闲的设备,当个体的设备空闲时再让设备执行对强化学习的训练。