摘要

相机视角引起的头部尺度多变性和人群分布的多样性是图像人群计数中存在的两个主要挑战,很多方法试图通过采用多列或者多分支网络来解决这些问题,但由于受列数或分支数的限制,提取的特征尺度有限.本文提出一种面向人群计数的多通道融合分组卷积神经网络,该网络主要由两个部分组成:采用预训练的VGG网络前10层作为基础主干网络,以多通道融合分组卷积模块作为网络的第二部分,多通道融合分组卷积模块是本网络的关键组成部分,该模块中每个分组卷积模块都与其他层之间密集相连以获得不同层次的特征,同时,我们引入分组卷积来减少网络参数.在三个公开的数据集(ShanghaiTech,UCFCC50,UCFQNRF)上进行验证,实验结果证明了本文所提方法的有效性.