HSKDLR：同类自知识蒸馏的轻量化唇语识别方法

马金林; 刘宇灏<sup>*</sup>; 马自萍; 巩元文; 朱艳彬

摘要

针对唇语识别模型的识别率较低和计算量较大的问题，提出一种同类自知识蒸馏的轻量化唇语识别模型(HSKDLR)。首先，提出关注唇部图像空间特征的S-SE注意力模块，用其构建提取唇部图像通道特征和空间特征的i-Ghost Bottleneck模块，以提升唇语识别模型的准确率；其次，基于i-Ghost Bottleneck构建唇语识别模型，该模型通过优化瓶颈结构的组合方式降低模型计算量；然后，为提升模型准确率，减少模型运行时间，提出同类自知识蒸馏(HSKD)的模型训练方法；最后，使用同类自知识蒸馏方法训练唇语识别模型，并检验其识别性能。实验结果表明：与其他方法相比，HSKDLR具有更高的识别准确率和更低的计算量，在LRW数据集上的准确率达87.3%，浮点数运算量低至2.564 GFLOPs，参数量低至3.872 3×107；同类自知识蒸馏可被应用于大多数唇语识别模型，帮助其有效提升识别准确率，减少训练时间。

单位
北方民族大学

收藏分享被引(1) 浏览

更新时间：2024-03-18 10:11

HSKDLR：同类自知识蒸馏的轻量化唇语识别方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友