摘要

已有的基于智能代理的发电商竞价模拟研究多集中于单一决策目标,缺少多重决策目标的分析建模,此外在代理学习过程中,策略空间一般是固定的,缺乏灵活性。为此,提出一种基于综合效用函数和动态策略空间的发电商竞价模拟方法,同时结合强化学习中的RE-learning算法,实现对其竞价行为的模拟。仿真结果表明,所提方法能探索到更优的均衡点,同时可模拟发电商对总体收益和机组相对利用率间的综合考虑行为。