摘要

视频显著性目标检测旨在利用计算机自动识别提取视频序列中具有显著性特征的区域或目标。随着大数据时代的到来,视频内部包含的空时信息愈发复杂,实现高效准确的检测成为当下研究的难点。因此,提出基于帧间差分和深度语义特征的视频显著性目标检测算法。首先,利用改进后的帧间差分算法计算相邻视频帧在RGB这3个颜色通道上的差分值,加权求和后提取视频流在时间上的运动特征,计算时间显著性线索;其次,基于深度卷积神经网络提取每一帧视频的深度空间特征,计算空间显著性线索;最后,运用GOP算法从语义层次提取每一帧视频的建议目标候选对象,并结合时间显著性线索和空间显著性线索评估每个目标候选对象,得出每个候选对象为显著性目标的置信度得分,根据置信度得分将这些目标候选对象进行加权融合,得到最后的视频显著性目标检测结果。在公开数据集上的测试结果表明,所提算法实时性好,检测精度高,整体性能优于目前的主流算法。