一种基于强化学习的教学路径规划方法及推荐系统

作者:曹桂涛; 张欣悦; 郑北辰; 薛耀锋; 刘诗语; 刘勇
来源:2022-05-18, 中国, CN202210539142.X.

摘要

本发明公开了一种基于强化学习的教学路径规划方法,所述方法包括:步骤一、收集授课资源、教师授课时的行为数据及持续时间、教学路径推荐数据,定期更新到动态数据库中步骤二、将授课环境抽象到马尔科夫奖励过程的五元组框架中;步骤三、利用基于价值驱动的无模型强化学习算法创建动作-价值表,确定某一时刻状态下,采取特定动作能够获得的奖励;步骤四、基于动作-价值表,寻找一种策略最大化未来收益回报,基于此策略并兼顾学生接受度,智能体安排出最优教学路径。本发明还公开了实现上述规划方法的教学路径推荐系统,所述系统包括数据存储单元、环境建模单元、学习策略单元、教学路径推荐单元。