基于马尔可夫决策过程的算法研究

作者:肖铮
来源:河北软件职业技术学院学报, 2021, 23(01): 8-11.
DOI:10.13314/j.cnki.jhbsi.2021.01.003

摘要

基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题。首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估。结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势。