摘要
机器翻译出来的译文质量一直不高,对于较长,较为复杂的句式,翻译很容易出现错误,影响了读者对原文的理解。针对上述问题,为提高机器翻译质量,研究一种基于最大熵模型的机器翻译错误自动检测方法。该方法预处理机器翻译译文,包括基于词典的切分、基于CNN模型的词性标注两种预处理;基于预处理好的机器翻译译文,利用遗传算法提取特征,包括词后验概率特征、语言学特征、条件随机场特征三种;以提取的特征为输入,利用最大熵模型实现机器翻译错误识别。结果表明:三种机器翻译软件翻译出来的译文,所研究检测方法应用下,F-measure值均大于0.8,说明所研究检测方法的准确性更高,可以有效发现机器翻译中的错误。
- 单位