摘要
从平行句对中自动抽取短语对应单位,能够使平行语料库更好地用于词典编纂、机器翻译以及翻译教学等领域。本文构建了政治外交领域俄汉平行语料库(句对27 664对,2 010 632字/词),依照所设计的俄汉短语切分规则和构成模式统计并获得了单语种短语,并基于短语长度、词典、机器翻译三维评估模型实现了短语对应单位的自动对齐(215 373对短语)。通过将自动处理结果与人工标注结果进行对比评估,证明了语料库的实用性和短语对应单位抽取方法的准确性和有效性(完全对齐56.43%,部分对齐31.91%)。该研究为基于平行语料库的短语对应单位抽取提供了可行的研究思路和方法借鉴,对翻译学、词典学和语料库语言学研究均有启示意义。
-
单位信息工程大学