摘要
针对手语生成中源语言和目标语言是同类语言的特殊性,提出一种融合机器翻译方法与复述生成方法的两阶段中文手语文本生成方法。首先,通过机器翻译方法生成包含一定语义信息的结果,为了增加关键词的影响力,此阶段在多语言双向和自回归转换器(multilingual bidirectional and auto-regressive transformers, mBART)模型中增加了注意力层;然后,使用复述生成方法对上一阶段结果进行修正。为了使模型更适用于中文文本生成,对质量控制转述生成(quality controlled paraphrase generation, QCPG)模型中的词法评价指标进行了优化,帮助模型获得更加准确的单词语义分布。实验结果显示,相比基线模型,提出的两阶段模型在手语生成任务上的BLEU、ROUGE指标都有所提升。
- 单位