摘要
强化学习是一种促进智能体在与环境交互过程中通过学习策略达成回报最大化的人工智能方法。在不进行优化计算和不充分了解市场机制的情况下,该方法非常适合处理小规模用户电能交易行为。文中首先建立了包含交易主体、交易电价和交易物理约束的产消用户端对端电能交易模型。其次,将电能交易问题等效为一个马尔可夫决策过程并对各学习要素进行建模。然后,基于Q-Learning强化学习算法,对马尔可夫决策过程中储能动作和交易策略选择问题进行均匀离散处理,并进行分析求解。最后,采用含多类型产消用户和消费用户的电能交易案例进行分析,验证强化学习方法在解决小规模产消用户端对端电能交易问题上的合理性和可行性。
-
单位智能电网教育部重点实验室; 天津大学; 国网天津市电力公司