近年来,水声传感器网络越来越成为研究的热点,但由于水下环境复杂多变,导致网络中能量消耗不均的问题.针对此问题提出了一种基于增强学习的非均匀分簇的水声传感器网络路径优化算法.该算法首先根据水声传感器网络中节点的深度和剩余能量把传感器节点分成大小不同的簇;然后根据节点的综合属性值选出最佳簇头;最后在数据传输阶段利用增强学习和ε-greedy策略对簇间的传输路径进行决策和学习,寻找最优路由.实验结果表明:本文方法可以有效均衡能耗,并延长网络寿命.