摘要
片上网络具有良好的可拓展性和并行性,能够应对多核处理器的各种通信需求。路由算法对片上网络的性能和效率有较大的影响。网络流量不均衡可导致拥塞和热点,严重影响整个网络的性能。当前学界已提出了本地感知、区域感知和全局感知的自适应路由算法来缓解拥塞问题。然而,这些算法依然存在一些问题,如近视、非全局最优、开销高。本文提出了基于强化学习中sarsa奖惩机制思想的路由算法,简称TCRA。TCRA针对Mesh网络中无死锁的路由限制来确定每一跳的可选输出端口,并基于sarsa模型进行非最短路由的策略选择和拥塞值更新。此外,TCRA中还引入了基于延迟的阈值更新机制,通过增加一些阈值的限制来动态调整拥塞值,从而平衡网络中的流量分布。实验结果表明,与传统的区域感知路由算法相比,TCRA能够将网络延迟平均减少30%,并降低13%的功耗。与传统的基于强化学习的路由算法相比,TCRA也能够平均降低20%的延迟,并具有较低的路由器面积开销。
- 单位