基于分层ERNIE模型的中文嵌套命名实体识别

贾李睿智; 刘胜全<sup>*</sup>; 刘源; 魏富源; 孔博; 王光耀

doi:10.16163/j.cnki.dslkxb202111100001

摘要

近年来中文嵌套命名实体识别的相关研究进展缓慢，BERT和RoBERTa等预训练模型在处理中文语言时，导致模型只能学习到不完整的语义表示.针对以上两个问题，首先使用现有的中文命名实体基准语料库ACE2004和ACE2005,依照原始语料的中心词和外延的关系自动构造嵌套命名实体；然后使用分层ERNIE模型在构建好的中文语料库上进行中文嵌套命实体识别的研究，相较于BERT等模型，ERNIE模型则是通过对中文实体语义单元的掩码，使得模型学习完整概念的语义表示.实验结果表明，分层ERNIE模型在ACE2004和ACE2005两个中文嵌套命名实体语料库上F1值分别为84.5%和85.9%,性能优于BERT和RoBERTa模型.

单位
新疆大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 16:53

基于分层ERNIE模型的中文嵌套命名实体识别

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友