摘要
音频信号某区域的关注情况受音频特征的影响,目前主要自下而上的关注区域提取算法大多将一维音频信号转至二维图像利用图像显著性算法进行分析,往往忽略了关注事件在时间维度上的持续性特征。针对此问题,基于音频信号的信息熵特征同时引入统计学时间趋势相关算法,通过对信号分帧求取信息熵值,再进行指数移动平均等计算得到关注度值,从而确定高关注区域。与当前的主流关注度提取算法进行对比,在很好检测到关注区域的起止点基础上,计算得到的关注度值整体更平滑,同时考虑了人耳听觉系统对某事件关注的持续性特点,通过对一段脱口秀节目音频进行实验,得到整体掌声笑声片段检出率为81. 6%。
-
单位武汉轻工大学; 湖北文理学院