摘要

为实现多语言聊天场景中的机器翻译,提出了一种融合先验知识的机器翻译方法及系统。首先,搭建多聊天系统整体框架,该框架包含应用层、表示层和数据层;其次,为实现多语言聊天,构建BPE+TextCNN的语言检测模型;然后搭建以Transformer翻译模型为基础的Seq2Seq翻译框架,并增加BPE embedding层和先验知识编码器,以此解决传统翻译过度依赖语料库的问题,实现语料库的自学习和训练。结果表明,BPE+TextCNN语言检测模型对语言检测的准确率达98.1%;融合先验知识的机器翻译模型对中-英和英-中互译的BLEU得分达29.75和38.16;系统测试得出,基于机器翻译的多语言聊天系统线上运行良好,用户满意度高达98%。由此表明本研究构建的多语言聊天技术可行,可实现多语种对话翻译。

全文