一种基于视频字幕的多模态视频摘要提取方法

胡珍珍; 王振山; 宋子杰; 洪日昌

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于视频字幕的多模态视频摘要提取方法

作者：胡珍珍; 王振山; 宋子杰; 洪日昌

来源：2023-06-27, 中国, CN202310767163.1.

摘要

本发明公开了一种基于视频字幕的多模态视频摘要提取方法,包括：1获取视频的帧特征表示,2.获取字幕的特征表示,3.自动化的视频帧重要性评估,5.优化摘要器模型,6.优化基于关键帧的视频字幕生成器。本发明能快速输出短视频的关键帧集合及其对应的字幕,其中,关键帧集合以较少数目的视频帧以视觉的形式反映了视频的整体内容,相匹配的字幕则以文本的形式去概括视频画面,帮助用户更有效率的筛选短视频,并能节约存储空间和计算资源,更有利于部署应用于终端设备。

单位
合肥工业大学

收藏分享被引浏览

更新时间：2024-10-25 01:24

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号