融合双向依存自注意力机制的神经机器翻译

李治瑾; 赖华<sup>*</sup>; 文永华; 高盛祥

摘要

针对神经机器翻译中资源稀缺的问题，提出了一种基于双向依存自注意力机制（Bi-Dependency）的依存句法知识融合方法。首先，利用外部解析器对源句子解析得到依存解析数据；然后，将依存解析数据转化为父词位置向量和子词权重矩阵；最后，将依存知识融合到Transformer编码器的多头注意力机制上。利用Bi-Dependency，翻译模型可以同时对父词到子词、子词到父词两个方向的依存信息进行关注。双向翻译的实验结果表明，与Transformer模型相比，在富资源情况下，所提方法在汉-泰翻译上的BLEU值分别提升了1.07和0.86，在汉-英翻译上的BLEU值分别提升了0.79和0.68；在低资源情况下，所提方法在汉-泰翻译上的BLEU值分别提升了0.51和1.06，在汉-英翻译上的BLEU值分别提升了1.04和0.40。可见Bi-Dependency为模型提供了更丰富的依存信息，能够有效提升翻译性能。

单位
昆明理工大学; 自动化学院

收藏分享被引浏览

更新时间：2024-03-20 09:56

融合双向依存自注意力机制的神经机器翻译

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友