本发明公开一种音乐生成方法、系统及电子设备,涉及音乐数据处理技术领域。本发明在强化学习模型的基础上引入了长短时记忆网络来作为音符预测模型,辅助乐理规则共同构建奖励函数,这种奖励模式不仅包含着从海量数据中学习的信息,还一定程度上遵循着音乐理论知识,同时兼备探索新的旋律和遵循音乐理论的要求,使得最终构建型号才能的强化学习模型能够自动生成音乐,并且在生成音乐的同时,能够在遵循音乐理论和探索新的音乐旋律间保持平衡。