文章利用数学函数算法对皮革制品运输配送过程进行模型描述;并基于增强学习算法基础,采用奖励函数和状态转移函数对皮革制品运输过程进行智能体强化学习,即通过不断迭代模型优化使配送路径在最短时间内成本降到最低,旨在为皮革企业制品运输优化模式提供思路。