摘要

随着越来越多的新能源发电商加入电力现货市场的竞价行列,各发电商都面临着如何调整报价策略来使自身利益最大化的问题。为了解决各发电商的报价策略问题,提出了基于多智能体强化学习的MARL-SCCP模型来模拟各发电商的竞价行为以学习报价策略。上述模型首先将每一个发电商建模为一个智能体。其次在建模过程中使用随机机会约束规划来解决风力发电商的不确定性。最后,将神经网络引入WoLF-PHC算法来更好应对智能体较大的状态空间并大幅提高求解速度。实验表明,使用多智能体强化学习来模拟各发电商的竞价过程是可行的,并且能够在较少的迭代次数后学习到较优的策略。在此策略下,各发电商均能实现利益最大化,且新能源发电商能够减少由外界不确定性带来的影响。

  • 单位
    四川大学; 四川中电启明星信息技术有限公司