摘要

由于摄像机、回放速度、光照条件、剪辑效果、比赛结构和类型等方面的差异,体育视频摘要的自动分析具有挑战性。为了解决这些问题,针对户外运动视频,本文提出一种基于镜头分类和回放检测的有效视频摘要框架。准确的镜头分类对于更好地安排输入视频从而进行进一步处理(关键事件或回放检测)是必要的。因此,提出一种基于轻量级卷积神经网络的镜头分类方法。该方法对每一个镜头进行回放检测;特别地,检测出从体育视频中识别出回放片段的连续标识转换帧。为此,提出局部八元模式特征来表示视频帧,并训练极限学习机分为回放或非回放两类。所提框架对于摄像机、回放速度、镜头速度、光照条件、比赛结构、运动类型、广播公司、标识设计和位置、帧转换和剪辑效果具有鲁棒性。基于YouTube体育视频集中的足球、棒球和板球运动对所提框架进行性能评估。实验结果证明所提框架能够可靠地用于户外运动视频摘要的镜头分类和回放检测。