摘要

人群计数是指计算单张图像或单个视频帧中人的数目,为了解决人群任务的计数不够准确的问题,提出了一种基于多任务学习及由粗到精的卷积神经网络人群计数模型。首先,多任务学习是指引入与原始任务相关的辅助任务,指导主要任务的学习,人群密度估计是人群计数模型的主要任务,人群分割任务作为辅助任务以提高网络性能。其次,由粗到精策略表明人群计数模型预测密度图是一个由粗糙到精细的过程,即生成粗糙且不准确的人群密度图,结合人群分割图后得到准确的人群密度图。在Shanghai Tech数据集Part A部分、Part B部分和UCFCC50数据集上的实验表明,所提人群计数模型相比之前最好的CSRNet模型绝对误差分别降低了4.55%,14.15%,19.09%,均方误差分别降低了10.00%,19.09%,19.47%,显著提高了人群计数模型的准确性和鲁棒性。