视觉导向的对抗型模仿学习研究综述

崔铭; 龚声蓉<sup>*</sup>

摘要

最优决策问题在机器学习领域由来已久。模仿学习从强化学习发展而来，研究如何从专家数据中重建期望策略进而学习最优决策。近年来模仿学习既在理论研究中和计算机视觉有所结合，又在自动驾驶、机器人等应用中取得不错的成效。首先介绍模仿学习的由来及传统的两种研究方法，分别是行为克隆和逆强化学习，随着对抗训练结构的发展，生成对抗模仿学习成为现今的重点研究方向，而对其后续改进工作统称为对抗型模仿学习；其次分析了对抗型模仿学习结合视觉演示的研究内容，并针对存在的次优专家演示样本、少样本、样本利用效率低下等共性问题以及现有的对应改良方案进行总结；然后根据实验结果对比分析不同方法所解决的问题表现；最后说明对抗型视觉模仿学习在实际中的无人驾驶、工业机器人等场景的应用情况，总结并指出未来理论研究方向以及应用前景与挑战。

单位
苏州科技大学

收藏分享被引浏览

更新时间：2024-03-18 12:51

视觉导向的对抗型模仿学习研究综述

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友