基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题。首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估。结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势。