摘要
本发明公开了一种基于多路特征的记忆网络视频摘要方法,视频输入模块,所述视频输入模块用于,录入待处理的视频帧;特征提取模块,所述特征提取模块用于,提取视频图像中的原始特征,并将每个视频采用一个K*1024维的向量表示,将两两视频帧之间的差异作为差异特征,然后将差异特征和原始特征同时输入到RNN记忆网络中,由于RNN在视频帧中捕获长期依赖关系的能力,只更新时间记忆网络,本发明可以更好地包含图像的有用信息,记忆更新模块,组建记忆网络,使其可以建立视频帧之间显著区域、对象之间的联系,对视频帧包含的信息达到一个长期有效的记忆,联合多路特征之间的差异信息有效地进行关键帧提取,使其达到我们的预期效果。
- 单位