基于自注意力机制的口语文本顺滑算法

吴双志; 张冬冬; 周明

摘要

口语文本顺滑技术是语音翻译系统中的重要组成部分。其目标是识别并删除语音识别文本中所包含的重复、停顿、修正、冗余等口语现象,进而使口语文本更加书面化,增加文本的可读性和可理解性,有助于提高后续语言处理任务的准确率。本文针对口语文本顺滑问题提出一种基于自注意力机制的识别技术。该技术利用了深度学习中的自注意力神经网络。自注意力神经网络具有很强的序列建模能力,本文首先利用自注意力网络对口语文本进行编码,在此基础之上识别文本中的不流畅因素。在公开数据集上的测试结果表明本文提出的方法可以有效地识别口语中的不流畅因素。

单位
哈尔滨工业大学

收藏分享被引浏览

更新时间：2024-04-10 06:40

基于自注意力机制的口语文本顺滑算法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友