摘要
复杂量子系统的高精度控制是实现量子计算和量子信息处理的关键技术之一.深度强化学习算法已经应用到量子控制问题中,可以为不同的量子系统设计最优策略.为实现量子系统快速高精度的量子态制备,本文提出一种基于熵和不等概率的深度强化学习算法,其中引入了信息论中熵的概念以改进动作选择策略.通过当前状态的动作值得到该状态的熵值,并根据熵值选择进行“探索”(exploration)或者“利用”(exploitation),其中针对“利用”采用不等概率进行随机选择动作.所提强化学习算法中的智能体(agent)对于学习程度充分的状态专注于利用,对于学习程度非充分的状态则专注于探索,直到完成任务.在量子位系统上的数值仿真结果表明,与传统的强化学习算法相比,本文算法能够以更快的收敛速度和保真度实现本征态和纠缠态的制备.
- 单位