为有效支撑网络和计算深度融合的发展需求,新型的算力网络架构应运而生。在此背景下,如何实现算网资源的智能感知以及计算任务的高效调度,是当前网络需要解决的关键问题。为此,分析了面向算网融合的新型网络场景,设计了计算任务与算力节点的调度模型,提出了一种基于深度强化学习的资源调度算法。所提算法通过感知用户设备、算网资源可用容量和链路状态等关键信息,能够智能地做出系统成本最小的调度决策。最后,通过仿真实验验证了所提算法在节约系统成本方面的有效性。