摘要

常见的机器翻译方法有两种,一种是已经发展得比较完善的统计机器翻译,另一种是出现不久的神经机器翻译。这两种翻译方式首先都需要将文本划分成词或短语,对于一些语种,如中文,词并不是明显分开的,必须要分词。分词的时候,需要使用词典,通常词典是人工生成人工添加。本文提出了一种方式,可以从复数文本中自动提取分词词典。