摘要

传统的辅助决策方法中,专家系统通常由固定知识表达,完全依赖领域专家知识,不具备学习能力。为了弥补专家系统的局限性,利用对智能体进行训练的方法自动生成决策方案。分析了自动机和行为树等过程性建模方法的优缺点,提出了基于Petri网和Q学习的CGF行为与决策建模方法。介绍了模型的基本结构和强化学习机制。在虚拟场景中,设计了决策模型实现方法和学习规则,通过对比实验,证明了此方法的可行性。