摘要
基于卷积神经网络(CNN)获得回归密度图的方法已成为人群计数与定位的主流方法,但现有方法仍存在两个问题:首先传统方法获得的密度图在人群密集区域存在粘连和重叠问题,导致网络最终人群计数和定位错误;其次,常规卷积由于其权重不变性,无法实现对图像特征的自适应提取,难以处理复杂背景和人群密度分布不均匀的图像。为解决上述问题,提出一种基于像素距离图(PDMap)和四维动态卷积网络(FDDCNet)的密集人群计数与定位方法。首先定义了一种新的PDMap,利用像素级标注点之间的空间距离关系,通过取反操作增强人头中心点周围像素的平滑度,解决人群密集区域的粘连重叠;其次,设计了一种FDDC模块,自适应地改变卷积四个维度的权重,提取不同视图提供的先验知识,应对复杂场景和分布不均匀导致的计数与定位困难,提高网络模型的泛化能力和鲁棒性;最后,采用阈值过滤局部不确定预测值,进一步提高计数与定位的准确性。在NWPU-Crowd数据集上,所提方法的绝对误差(MAE)和均方误差(MSE)分别为82.4和431.6,与MFP-Net(Multi-scale FeaturePyramidNetwork)相比,所提方法的MAE和MSE降低了8.7%和5.8%,所提方法的综合评价F1和精确率P分别为71.2%和73.6%,与TopoCount(Topological Count)方法相比,所提方法的综合评价F1和精确率P分别提升了3.0%和5.9%。实验结果表明,所提方法能够处理复杂背景的密集人群图像,实现了更高的计数准确率和定位精准度。
- 单位