摘要

丰富的平行语料库对提升机器翻译准确度意义重大,然而目前研究中缺乏有效的平行语料获取方法,本文提出一种从多语种网站中自动获取平行语料的方法,并且通过6个多语种网站的平行语料采集和对齐研究,验证通过多语种网站获取大规模平行语料具有较高的可行性,这说明通过多语种网站获取大规模平行语料具有较高的可行性。

  • 单位
    中国传媒大学