摘要

现有的机器人在未知环境下的行为能力与人类相比还有很大的差距。为了使机器人能够像人类一样持续在线地提升自身的行为能力,提出了人在环路的机器人在线可持续学习方法。首先,改进基于径向基函数网络的增量式学习,将人类加入到机器人学习的环路中,使机器人通过主动问询人类的方式获取新的学习样本,并基于该样本在线增量式地更新自身的行为。其次,基于贝塞尔曲线的轨迹规划方法将人类提供的高层行为转换成机器人可执行的低层动作,降低人类示教成本,同时提高所学行为的稳定性。然后,借鉴大脑的工作机理,提出类人的机器人潜意识学习方法,使机器人在内部世界产生虚拟学习样本,增加行为学习的鲁棒性。最后,走廊行驶行为学习实验显示机器人能够主动地与人类交互,并且高效、在线可持续地学习到鲁棒的行为。结果表明,所提方法使机器人具备类人的可持续在线提升自身行为的能力。

  • 单位
    之江实验室