摘要
本发明公开了一种基于场景语义的目标检测方法、装置、终端设备及存储介质,该方法包括:构建目标检测模型;将训练图像输入特征图提取网络中,得到多尺度特征图;将多尺度特征图输入场景语义特征提取网络,得到场景语义特征;根据场景语义特征,计算场景预测的多标签分类损失;将多尺度特征图输入候选目标特征提取网络,得到候选目标特征集合;将场景语义特征和候选目标特征集合输入融合网络进行融合,得到新候选目标特征集合;再输入检测头部网络进行分类与回归操作,计算分类损失与回归损失;联合三个损失函数对目标检测模型进行训练;将待测图像输入训练好的目标检测模型中,得到检测结果。本发明能解决目前难以识别具有模糊外观的目标的问题。
- 单位