基于掩码机制的非自回归神经机器翻译

贾浩; 王煦; 季佰军; 段湘煜<sup>*</sup>; 张民

摘要

当前基于自注意力机制的神经机器翻译模型取得了长足的进展,但是采用自回归的神经机器翻译在解码过程中无法并行计算,耗费时间过长.为此,提出了一个采用非自回归的神经机器翻译模型,可以实现并行解码,并且只使用一个Transformer的编码器模块进行训练,简化了传统的编码器-解码器结构.同时在训练过程中引入了掩码机制,减小了与自回归的神经机器翻译的翻译效果差距.相比于其他非自回归翻译模型,该模型在WMT 2016罗马尼亚语-英语翻译任务上取得了更好的效果,并且在使用跨语言预训练语言模型初始化后,取得了和自回归神经机器翻译模型相当的结果.

单位
苏州大学

收藏分享被引浏览

更新时间：2024-04-17 14:45

基于掩码机制的非自回归神经机器翻译

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友