摘要

投资组合问题是指投资者在控制风险的情况下将资产重新分配到不同产品中,实现收益最大化。利用深度强化学习中的TD3算法,并构建基于长短期记忆网络(long short-term memory,LSTM)的TD3算法投资组合模型来进行研究,同时将股票投资组合交易过程定义为马尔可夫决策过程模型。结果表明,深度强化学习算法构建的投资组合模型在累计收益率,夏普比率,最大回撤等评价指标方面都要优于等权重投资组合。表明该方法可以优化投资组合策略,实现股票投资收益最大化,对于投资者来说具有有效的参考价值和研究意义,同时促进了计算机技术与金融领域更好地结合。