云计算环境作为互联网基础服务应用环境的使用范围越来越广泛,而云计算环境下任务调度算法的优劣则直接关系到云环境的服务质量,近年来一直是计算机领域研究和关注的重点问题。深度强化学习在各领域的优秀表现,将任务调度问题转化为马尔科夫决策过程后,使用深度强化学习的方式,构建云环境中任务调度模型与奖励函数,并利用智能体调度CloudSim云环境下的计算任务,最后通过实验验证该方式的有效性。