摘要

当传统神经网络训练样本不足时,网络对场景的识别错误率较高,且在执行任务的过程中无法连续学习,从而导致传统神经网络对陌生环境的适应性较差。针对这些问题,提出一种仿生的机器人行为决策认知计算模型。该计算模型采用半监督方法和状态转移学习方法,先使用少量训练样本对发育神经网络进行训练,使其具备基本的行为决策能力;机器人在实际环境中探索时,可以不断学习新的场景数据;当机器人完成任务时,计算模型会按照某种概率回忆所经历的特定场景,即回放在线执行任务时新学习到的经验数据,并结合状态转移机制,不断调整自身决策效果。这种方法可以使网络模型快速收敛到稳定状态,在未知环境中具有很强的适应性。为了验证模型的可行性,设计了真实的机器人运行环境,使用RIKIROBOT移动机器人来进行导航测试。实验结果表明:所提方法在未知环境中经过3~5次的决策调整即可收敛到稳定状态,且决策效果不断改善。通过不断积累知识,机器人可以应对各种复杂环境,在未知环境中具有很强的适应性。

全文