中文预设识别语料库的构建与预设识别

魏晓聪; 段懿桐; 刘思含

doi:10.19670/j.cnki.dlgydxxb.2023.0411

摘要

预设是普遍存在于人类语言中的一种特殊推理关系。为提升计算机对预设这一语言现象的自然语言理解能力，构建了基于人工标注的中文预设识别语料库。本语料库与中文自然语言推理数据集的识别难度大体相同。通过在本语料库上精调BERT-base、BERT-wwm-ext、RoBERTa、ELECTRA以及XLNet语言模型，结果表明，该语料库能够有效促进大规模预训练模型对预设语言现象的理解，对于体裁格式比较固定的触发类型模型识别较好，对问句、与事实相悖的条件从句识别准确率较低，现有大规模预训练语言模型仍然缺乏预设触发语含义的相关知识，在中文预设别方面还有很大的提升空间。

单位
大连外国语大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 18:13

中文预设识别语料库的构建与预设识别

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友