U-Clustering:基于效用聚类的激励学习算法

陈焕文; 殷苌茗; 谢丽娟

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

U-Clustering:基于效用聚类的激励学习算法

作者：陈焕文; 殷苌茗; 谢丽娟

来源：计算机工程与应用, 2005, (26): 37-42+74.

摘要

提出了一个新的效用聚类激励学习算法U-Clustering。该算法完全不用像U-Tree算法那样进行边缘节点的生成和测试,它首先根据实例链的观测动作值对实例进行聚类,然后对每个聚类进行特征选择,最后再进行特征压缩,经过压缩后的新特征就成为新的状态空间树节点。通过对NewYorkDriving[2,13]的仿真和算法的实验分析,表明U-Clustering算法对解决大型部分可观测环境问题是比较有效的算法。

单位
长沙理工大学; 湖南信息职业技术学院

收藏分享被引浏览

更新时间：2022-03-02 10:04

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号