摘要
针对数据集中的大目标和小目标难以同时检测、深层语义信息与浅层细节信息难以同时处理等问题,提出了将VGG16中不同尺寸特征图进行融合的多级融合卷积神经网络,以获得信息含量更大的特征图,更加准确地估计人群密度情况。选用VGG16作为骨干网络,将骨干网络中两个不同尺寸的特征层进行融合,并使用多通道空洞卷积,从不同大小感受野获取信息。通过多层级多通道的信息融合,网络框架接受信息的能力得到增强。为了验证模型的性能,提供了ShanghaiTech数据集的测试结果。研究结果表明,该网络框架回归的密度图更加精准,人群密度估计结果更加准确,具有更加优越的鲁棒性。
- 单位