摘要
以马尔可夫决策过程作为理论工具,将终端直通选择问题与有限阶段折扣MDP模型问题相结合,研究了网络吞吐量最优化问题。首先,利用MDP对终端直通选择进行建模;其次,利用有限阶段后向迭代算法给出最优模式选择策略;最后,通过进行大量的仿真实验,对给出的模式选择策略进行评估。结果表明,本研究提出的基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势。
- 单位
以马尔可夫决策过程作为理论工具,将终端直通选择问题与有限阶段折扣MDP模型问题相结合,研究了网络吞吐量最优化问题。首先,利用MDP对终端直通选择进行建模;其次,利用有限阶段后向迭代算法给出最优模式选择策略;最后,通过进行大量的仿真实验,对给出的模式选择策略进行评估。结果表明,本研究提出的基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势。