摘要

情感作为人类的高级认知,在环境学习和环境理解方面具有重要意义.本文将情感引入机器人搜索任务,同时结合记忆机理,提出一种具有情感与记忆机制的认知模型,由内部状态、感受器、环境状态系统、情感系统、动态知识库、行为决策系统以及执行器七部分组成.情感系统包含情感生成、情感状态以及情感记忆三个模块,其中,情感记忆用于提供内部奖励.记忆功能在动态知识库中实现.基于强化学习理论框架,将情感内部奖励与记忆进行融合,形成新的奖励机制,并设计相关认知学习算法.以需要“能量补给”的迷宫机器人搜索任务对本文认知模型进行验证,结果发现,当面对不同情境时,机器人会产生不同的情感.结合前期记忆,机器人所作决策更“拟人”,首先证明了情感与记忆机制设计的有效性.其次,将本文认知模型、无情感决策认知模型、基于ε-greedy策略的Q学习算法进行对比,结果表明,情感与记忆的引入,能够提高机器人的学习效率,同时学习过程更稳定.

全文