有限阶段马尔可夫决策的可变限速控制模型

王薇; 杨兆升; 赵丁选

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

有限阶段马尔可夫决策的可变限速控制模型

作者：王薇; 杨兆升; 赵丁选

来源：交通运输工程学报, 2011, (05): 109-114.

摘要

分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变限速控制过程看作是离散时间的马尔可夫决策过程,提出基于强化学习与有限阶段马尔可夫决策的可变限速控制模型,通过与交通环境的交互学习进行模型的动态调整。采用有限阶段向后递归迭代的算法对模型进行求解,运用Paramics仿真软件对长吉高速公路全程进行仿真。仿真结果表明:在平均限速值低于设计时速6.25%的情况下,平均流量不仅没有降低反而增加了3.20%。可见,该模型可以有效提高交通流量,改善高速公路主线的交通状况。

单位
吉林大学

收藏分享被引浏览

更新时间：2019-10-04 01:29

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号