摘要
强化学习(Reinforcement Learning)是解决序列化决策问题的途径之一,其在围棋、电子游戏、物理控制等确定环境下解决问题的能力已经得到证明。该文将强化学习应用到自动交易系统(Automated Trading System)的设计中,通过实验讨论了强化学习方法在混沌、动态环境下的表现,为自动交易系统的设计提出新的可能。不同于传统自动交易系统分别设计预测算法与策略算法的做法,基于强化学习的算法将两者合二为一,简化了设计步骤。该文第1章简述了强化学习发展现状;第2章阐述了金融交易问题的建模方法;第3章中通过实验,讨论了策略梯度算法与特征编码方式(RNN、CNN)在处理金融时序数据时的优劣。实验表明,使用RNN编码特征的方法有比较好的短期效果。最后,第4章总结了使用强化学习理论设计交易系统的优势与劣势。
- 单位