摘要
动作质量评估是视频分析中一个重要且具有挑战性的问题,动作质量评估是指对特定动作(如跳水、体操等)的完成质量进行评分,分数评估模型是通过将视频特征回归到该领域专家提供的真实分数来进行学习。现有的大多数方法是直接使用动作识别任务的模型如(C3D和I3D)来解决问题。为了增强网络模型的特征提取效果,从而提高分数回归的准确性,该文提出了一种基于残差结构的动作质量评估网络模型RFC-Net。该网络由特征提取器和特征聚合器组成,在特征提取器中使用I3D网络对视频特征进行提取,在特征聚合器中对特征提取器最后一层卷积得到的视频特征分别进行平均的全局池化和残差卷积操作,对得到的结果进行特征融合,最后输出视频的分数表示。在动作质量评估领域公开的MTL-AQA数据集上,该方法取得的斯皮尔曼相关性系数为0.946 3。为进一步验证模型在不同背景下、动作差异较大时的泛化能力,制作了羽毛球运动视频数据集,并在此基础上进行了不同模型之间的对比实验。
- 单位