摘要

针对柔性作业车间调度问题,以完工时间最小化为目标,提出一种融合强化学习的变邻域搜索算法,以提升算法求解性能。基于皮尔逊相关性分析,提炼出工序加工时长这一关键特征,设计一种优先考虑加工时长的邻域结构,以精炼搜索空间。基于强化学习,设计算法进化状态集、关键参数动作集和奖励机制;提出改进的ε-贪婪策略来选择动作,随着ε取值的自适应变化,算法前期倾向于探索新解,后期注重利用邻域解;最终构建起算法状态与算法参数的关联关系,实现了算法参数的自适应选择。实验表明所提算法利用强化学习动态调整算法参数,在解的寻优能力和稳定程度上更具优势。