基于权重计算的中文因果关系分析

作者:谭云; 彭海阔; 秦姣华*; 薛有元
来源:华中科技大学学报(自然科学版)科技大学, 2022, 50(02): 112-117.
DOI:10.13245/j.hust.220217

摘要

提出一种中文因果关系分析方法,以便更加细腻地表达因果关系.该方法由因果关系提取和权重计算组成.首先,构建了中文因果关系四元组数据集,将因果划分为核心名词和谓语状态,即原因中的核心名词、原因中的谓语或状态、结果中的核心名词、结果中的谓语和状态;然后,构建了中文因果关系抽取(CCE)模型,该模型由中文预训练的基于全词掩码训练的双向编码表示模型(BERT-wwm)和条件随机场(CRF)组成,在所构建的数据集上,四元组抽取F1分数为0.3;最后,提出基于因果强度的近似原因权重算法,用于计算同一结果不同原因的权重,减小对语料库数据量的依赖性,具有更好的鲁棒性和泛化性,能更加真实地反映不同原因对结果的重要程度.

全文