摘要
针对聚合视图目标检测(aggregate view object detection, AVOD)这种多传感器融合检测算法中锚框不准确、特征提取以及融合不充分等因素造成检测精度不高的问题,提出了一种优化算法:首先利用K-means++代替K-means生成三维锚框;然后以引入inception模型的GoogLeNet网络进行特征提取;最后加入注意力机制进行特征融合;并且通过调整学习率、权重衰减系数等超参数来提高检测精度。为了验证算法的有效性,在KITTI数据集上进行了车辆目标检测实验,结果表明,与AVOD算法相比,优化算法的鸟瞰视图(bird′s eye view, BEV)检测和3D检测的平均精度都有明显提高。
- 单位