摘要

当前的命名实体识别模型能够识别位于正确位置且符合语法表达的实体,却无法指出句子中的实体缺失与位于错误位置的实体,无法满足信息处理与归档分析中对于检测文本实体信息完整全面的要求。通过考察异常实体的识别依赖上下文相互联系语义特征的具体特点,提出以基于预训练语言模型的命名实体识别模型架构为基础,融合门控卷积网络与门控循环网络的实体位置异常与实体缺失异常检测方法(NER-EAD)及其训练数据构造方法。其中门控卷积网络提取特定字符上下文特征联系以更好识别实体异常。融合卷积神经网络结构和门控循环神经网络的语义特征输出可全面提取正常实体与异常实体的特征,实现了正常、异常实体识别结果同时输出。实验表明NER-EAD在正常实体、实体位置异常和实体缺失异常的识别平均F1分别达到90.56%、85.56%和80.92%,超越了已有命名实体识别模型架构。最后通过消融实验证明了GCNN与GRU融合网络的语义特征提取能力。