摘要
针对在人机交互中,因中文特殊性,导致对话翻译不自然、不流畅等问题,提出一种融合情感的开放域对话翻译系统。为尽可能地挖掘样本数据信息,通过词汇级别向量和字符级别向量相结合的方式,解决分词处理中的OOV问题。并利用双向LSTM解码器,联系单词上下文解码文本隐藏向量。结合引入注意力机制的LSTM解码器,对对话情感分布进行标注,并通过情感判断辅助模型,比较输入语句和输出翻译之间的情感距离,帮助模型确定对话的情感分布。测试结果表明,在对翻译效果的自动测评中,无论是单独单词还是双单词的测评上,融合情感的开放域对话翻译系统比Seq2Seq基本序列模型分别高出0.06和0.3个百分点,而和人工翻译相比则有一定差距;在翻译效果的人工测评中,内容全面性上融合情感的开放域对话翻译系统比Seq2Seq基本序列模型高出0.11-0.29个百分点,情感准确性上情感的开放域对话翻译系统比Seq2Seq基本序列模型高0.03-0.16,两方面较人工翻译都还有不足。这说明无论是在内容还是情感上,情感的开放域对话翻译系统都优于同类型其他翻译模型,具有一定的实用价值。但相较于人工翻译,则还有上升空间,需要进一步的研究。
- 单位