摘要
提出一种基于M ealy自动机的博弈模型,并应用于二人重复囚徒困境博弈。采用M ealy自动机对博弈参与人的决策行为进行建模,在模型中每个博弈参与人选择一个有限自动机,有限自动机在当前状态下与竞争对手的有限自动机进行博弈,依据所获取的效用转换到下一状态,并开始新一周期的博弈。在博弈过程中参与人追求平均效用最大,同时决策复杂度最小,这里用有限自动机的状态个数表示决策复杂度,模型解是一对有限自动机,有限自动机对在每阶段博弈中都是最优的。采用M ealy自动机表示单一战略、针锋相对战略、冷酷战略和带有惩罚的战略等几种常见的重复囚徒困境博弈战略模型,定义了基于M ealy自动机的重复博弈平均效用、纳什均衡、精炼均衡等概念,给出了定义的相关性质,并对这些性质进行证明。
-
单位工商管理学院; 重庆大学