针对唇语识别的上下文相关性蒸馏方法

赵雅; 冯尊磊; 王慧琼<sup>*</sup>; 宋明黎

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

针对唇语识别的上下文相关性蒸馏方法

作者：赵雅; 冯尊磊; 王慧琼^*; 宋明黎

来源：计算机辅助设计与图形学学报, 2022, 34(10): 1559-1566.

摘要

针对唇语识别模型的性能受到数据集大小限制的问题,提出一种跨模态知识蒸馏方法 C2KD.C2KD将语音识别模型的多尺度上下文相关性知识蒸馏到唇语识别模型中.首先,利用Transformer模型的自注意力模块得到上下文相关性知识;其次,使用层映射策略来决定从语音识别模型的哪一层提取知识;最后,使用自适应训练策略来根据唇语识别模型的性能动态地进行知识的传递. C2KD在数据集LRS2和LRS3上取得了优异的表现,词错误率分别比基线方法低2.0%和2.7%.

单位
浙江大学; 之江实验室

收藏分享被引浏览

更新时间：2024-03-20 22:17

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号