摘要

针对混流装配线的平衡与排序问题,提出了一种基于复合规则和强化学习的智能调度方法。根据数学模型,设计了平衡规则库与排序规则库,提出了规则加权组合的近端策略优化(PPO)算法,并利用具有Actor-Critic训练流程和优先经验回放机制的强化学习过程,实现了复合规则权值参数的调控优化,生成了平衡与排序方案。所提方法与PPO+单一规则算法、复合规则和遗传算法的对比实验验证了所提方法的有效性。