摘要

人体姿态估计在动画设计、安防监控、运动分析等领域的重要性不断增加。然而,目前的人体姿态估计算法注重准确率,导致网络复杂且计算成本高,难以在移动设备和嵌入式平台上应用。为了缓解这一难题,本文提出结合动态分裂卷积和归一化注意力的多尺度人体姿态估计网络DNSNet。首先,使用动态分裂卷积与动态内核聚合操作,重新设计了高分辨率网络的瓶颈层DKASCneck,避免过多使用大卷积核带来的计算成本的同时增强了网络对有用特征的提取能力;然后,提出了部分卷积与基于归一化的注意力机制的基础模块NAMPCblock,减少计算冗余和内存访问的同时保留了通道和空间方面的信息增强跨纬度交互;最后以多分辨率特征与反卷积为基础进行网络输出特征融合方式的重新设计,提升网络的热图回归预测准确率。实验结果表明,相对于高分辨网络,本文的网络模型在COCO验证集上平均准确率提升了2.1个百分点,同时运算复杂度减少了32.4%、模型参量降低了71.9%。在MPII验证集上,运算复杂度降低了38.9%、模型参量降低了71.9%。实验数据显示,所提出的网络可以大幅度降低网络复杂度的同时小幅提升检测精度。

  • 单位
    贵州大学; 贵阳铝镁设计研究院有限公司