数字人文视域下典籍动物命名实体识别研究&mdash;&mdash;以SikuBERT预训练模型为例

林立涛; 王东波<sup>*</sup>; 刘江峰; 李斌; 冯敏萱

摘要

通用命名实体识别难以满足不同领域研究的需要，特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。文章基于SikuBERT预训练模型，构建用于典籍动物命名实体识别模型，为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料，对SikuBERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练，构建多种用于识别典籍中动物命名实体的模型，并对这些模型进行识别性能测试，比较验证SikuBERT预训练模型的识别性能。结果表明：基于SikuBERT经训练所构建的动物命名实体识别模型效果最优，十折交叉测试的平均调和平均值（F1）为85.46%，最高一次达86.29%，应用于《史记》动物命名实体识别准确率达91.6%。

单位
南京师范大学; 南京农业大学

收藏分享被引浏览

更新时间：2024-03-19 23:20

数字人文视域下典籍动物命名实体识别研究——以SikuBERT预训练模型为例

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友