基于半马尔科夫决策过程的虚拟传感网络资源分配策略

王汝言; 李宏娟<sup>*</sup>; 吴大鹏; 李红霞

摘要

针对传统无线传感网络(WSN)中资源部署与特定任务的耦合关系密切,造成较低的资源利用率,进而给资源提供者带来较低的收益问题,根据虚拟传感网络请求(VSNR)的动态变化情况,该文提出虚拟传感网络(VSN)中基于半马尔科夫决策过程(SMDP)的资源分配策略。定义VSN的状态集、行为集、状态转移概率,考虑传感网能量受限以及完成VSNR的时间,给出奖赏函数的表达式,并使用免模型强化学习算法求解特定状态下的行为,从而最大化网络资源提供者的长期收益。数值结果表明,该文的资源分配策略能有效提高传感网资源提供者的收益。

单位
重庆邮电大学; 通信与信息工程学院; 中国联合网络通信有限公司

收藏分享被引(7) 浏览

更新时间：2024-04-10 16:18

基于半马尔科夫决策过程的虚拟传感网络资源分配策略

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友