摘要

激励型需求响应是一种通过补贴信号灵活调度需求侧能源的手段,对于维持电力系统供需平衡,提升经济效益有巨大潜力。在面向居民用户的激励型需求响应中,电力运营商选择削减电量潜力大的居民用户并向其提供补贴价格,以激励其削减电量。然而,站在电力运营商的角度,面对居民用户未知且不确定的用电行为,识别并选择削减电量潜力大的居民用户以及如何动态制定补贴价格是关键挑战。为了解决这一问题,本文提出基于在线学习的激励型需求响应算法(IDR-OL),利用多臂赌博机框架在线学习居民用户削减电量潜力,建立电力运营商运营成本优化模型选择最优参与需求响应的居民用户并动态制定补贴价格。仿真结果表明,本文提出的IDR-OL算法能够在实现供需平衡的同时更大限度地降低电力运营商运营成本。