摘要
神经机器翻译在许多任务上已取得了不错的效果,然而在低资源语种上的效果并不理想。针对这一问题,该文提出一种基于transformer的维汉机器翻译模型,该模型在transformer的基础上引入了循环机制和时间编码,使模型具有更好的泛化性和计算效率,同时在模型的输出端采用了beam search优化,针对模型的输出存在谐音字、混淆音字等问题采用了字粒度的语言模型困惑度进行评判。实验采用BLEU作为评价指标,实验表明,在少量维语与汉语的平行语料库的基础上,该文提出的改进transformer维汉机器翻译模型能够取得更好的效果,BLUE值提升了0.93%。
-
单位武汉邮电科学研究院