摘要
针对主流翻译质量评估框架在低资源语料上表现较差,句子嵌入策略单一的问题,提出了一个基于跨语言预训练模型的朝汉翻译质量评估模型。首先,借鉴注意力思想提出一种融合跨层信息和词项位置的句子嵌入方法;其次,将跨语言预训练模型引入翻译质量评估任务中,缓解朝鲜语低资源环境带来的数据稀疏问题;最后,对句向量进行回归,实现机器翻译质量评估任务。实验结果表明:该模型能有效提升朝汉翻译质量评估任务性能,与质量评估任务领域主流模型QuEst++、Bilingual Expert、TransQuest相比,皮尔逊相关系数分别提升了0.226、0.156、0.034,斯皮尔曼相关系数分别提升了0.123、0.038、0.026。
- 单位