摘要
随着物联网技术在智能健康管理领域的不断发展,用户能够通过智能设备感知和监测个人健康状况,并借助移动设备实现与健康信息服务提供商的数据交互,生成个性化运动锻炼方案。在这种实时交互的健康干预服务中,健康信息服务提供商采用数据驱动的方法,适应性地调整为用户推送的个性化运动目标,目的是实现用户长期健康效用最大化和提升用户的服务满意度。为了研究最优的个性化运动推送目标,首先对研究问题进行界定,构建实时交互的个性化运动目标决策模型;随后针对问题中用户行为不确定的特点,采用深度强化学习算法,结合了离轨策略时序差分学习方法以及神经网络非线性拟合方法,从用户的历史数据中学习策略;最后使用Fitbit的真实数据集验证了所提方法的有效性。研究结果表明,基于深度强化学习的个性化运动目标推送服务,通过实时分析用户行为数据,对用户进行科学的引导和适时的激励,有助于帮助用户培养健康的生活方式,提高个人健康管理水平。
- 单位