摘要

人群密度估计与计数是指对拥挤场景中人群分布及数量进行统计,对安全系统、交通控制等具有重要意义。针对高密度图像在人群密度估计中特征提取困难、空间语义信息获取较难、特征融合不充分等问题,本文提出一种多元信息聚合人群密度估计方法(Multivariate information aggregation,MIA)。首先,设计多元信息提取网络,采用VGG-19作为骨架网络提高特征提取深度,利用多层语义监督策略编码低层特征方式提高低层特征的语义表达,通过空间信息嵌入丰富高层特征空间信息表征;其次,设计多尺度上下文信息聚合网络,通过两个带有步长卷积的轻量级空洞空间金字塔池化(Simplify-atrous spatial pyramid pooling,S-ASPP)结构在进行全局多尺度上下文信息聚合的同时缓解模型参数冗余;最后,网络末端采用步长卷积,在不影响精度的前提下加快网络运行速度。采用ShanghaiTech、UCF-QNRF、NWPU数据集进行对比实验,实验结果 表明:在典型数据集ShanghaiTech的Part_A部分上的MAE、MSE分别为59.4、96.2,Part_B部分分别为7.7、11.9;超高密度多视角场景数据集UCF-QNRF的MAE为89.3,MSE为164.5;NWPU数据集的MAE为87.9,MSE为417.2。本文方法较对比方法性能有一定提升,且实际场景应用结果验证了本文方法效果较好。