摘要

跳频技术在无线通信中应用广泛,能够通过不同频点之间的转换,提高通信过程的安全性和抗干扰性,但此类系统对随机干扰信号和线性扫频干扰信号的识别、抵抗能力较差,产生了一定的使用缺陷。文章基于蒙特卡洛法和时序差分法,分别设计了在线和离线的强化学习算法,旨在探索提高系统抗干性的途径。经过MATLAB仿真检验,相关算法能够在较少的迭代后实现收敛,具备较强的干扰识别和规避能力。