摘要
为提高组网稳定性,选取合适的低压电力线通信(LVPLC)拓扑控制方法至关重要。针对现阶段组网方法不具备自学习能力使得对动态变化的拓扑反应能力相对滞后导致网络不稳定的问题,提出一种适用于LVPLC局域网多约束的改进Q学习算法。该算法基于绑定载波侦听多址接入协议,将非对称信道组网系统建模为离散Markov决策过程。通过与未知环境的不断交互,关联注册节点信息,建立路由表,经周期性地在线学习训练,节点选择较优的转发方向,优化以网关为树根的簇树;周期性地轮换代理,维护并更新骨干簇树网的逻辑拓扑,延长网络生命周期,保证组网的稳定性。仿真结果验证了该算法的有效性与泛化能力。
-
单位哈尔滨工业大学; 自动化学院