摘要

<正>铜谷贤治:用于心智模拟的神经环路强化学习算法的开发。铜谷贤治教授团队通过研究神经系统的强化学习功能环路,开发更为高效的强化学习算法。运动学习功能的强化学习方法包含诸多重要的计算部分,例如从过去状态或动作中评估当前状态,通过奖励预测状态或动作、动作选择以及预测状态的更新。强化学习的对象可以是人、动物或机器人,或者是与环境交互的软件。团队致力于开发针对对象的高效算法,并探究大脑的工作机制。