摘要
针对密集场景下因尺度变化和遮挡等现象导致的人群计数精确率不高,在HRNet中将真值图生成为互不重叠的独立区域,便于网络密度图人群位置统计;然后引入3D注意力机制,使得网络专注于特征图的有用信息;最后在训练时将均方误差损失(MSE loss)、L1损失和交叉熵损失(Cross Entropy loss)相结合作为总的损失函数,优化模型泛化能力.上述方法的结合提高了模型在人群计数及人群位置定位中的准确性.将该模型在公开数据集NWPU、Shanghai Tech和UCF-QNRF中与近年来的主要方法进行对比,实验结果表明该模型可有效提升人群位置计数问题的准确性和鲁棒性.
-
单位安徽信息工程学院; 电子工程学院