基于ERNIE-Gram和TinyBERT混合模型的复句关系体系转换

作者:杨进才; 陈雪松; 胡泉; 蔡旭勋
来源:中文信息学报, 2022, 36(12): 16-26.
DOI:10.3969/j.issn.1003-0077.2022.12.002

摘要

复句关系是指分句间的语义关系。目前关于复句关系的分类体系有很多,复句三分系统与HIT-CDTB分类体系为其代表。对不同分类体系各类别进行相互转换可以为机器翻译等任务提供支持。该文基于预训练模型ERNIE-Gram和TinyBERT,嵌入主成分分析方法,提出一种三阶段复句关系识别混合模型,实现三分系统与HIT-CDTB两种分类体系下复句关系的转换。通过实验检验,复句三分系统到HIT-CDTB以及HIT-CDTB到复句三分系统关系转换的准确率分别达到77.60%、89.17%。

全文