中文多方对话篇章结构语料库构建及分析模型

作者:何威恺; 蒋玉茹; 陈杰; 李宇; 张仰森
来源:北京信息科技大学学报(自然科学版), 2023, 38(05): 10-18.
DOI:10.16508/j.cnki.11-5866/n.2023.05.002

摘要

针对面向篇章结构分析的对话文本语料库缺乏的问题,构建了第一个中文的日常生活场景下多方对话篇章结构语料库。同时,提出了一种基于图神经网络的篇章结构分析模型,针对日常生活场景下多方对话的特点,使用图注意力网络进行图网络设计和基本篇章单元编码;并且模型融入了角色识别特征及少量手工特征,使得篇章结构分析性能进一步提升。该模型在所构建的语料库上的实验结果与基线模型相比,篇章结构分析中的链接识别和关系识别两个任务的F1值分别提升了7.8和3.6百分点。

全文