摘要
[目的/意义]从实体关系抽取视角出发,将单一语言情境下的知识获取任务扩展到跨语言情境,提升低资源语言的关系抽取效果。[方法/过程]提出一种跨语言对抗关系抽取(Cross-Lingual Adversarial Relation Extraction, CLARE)框架,将跨语言关系抽取分解为平行语料获取和对抗适应关系抽取两个子模块。通过词典扩展或自学习方法将源语言关系抽取数据集转换为目标语言数据集,在此基础上利用对抗特征适应将源语言的特征表示迁移给目标语言,再利用训练得到的目标语言关系抽取网络对目标语言进行关系分类。[结果/结论]将本文方法应用到以ACE2005多语言数据集为基础的英语-中文、中文-英文两种跨语言关系抽取任务上,最优模型的Macro-F1值分别为0.880 1和0.842 2。实验结果表明本文提出的跨语言对抗关系抽取CLARE框架能显著提升低资源语言实体关系抽取的效果。研究结果对于改进跨语言情境下的关系抽取模型以及促进实体关系抽取研究在情报学领域的应用具有重要意义。
-
单位数学学院; 中南财经政法大学