数字人文视域下典籍动物命名实体识别研究&mdash;&mdash;以Siku BERT为例

林立涛; 王东波; 刘江峰; 李斌; 冯敏萱

摘要

通用命名实体识别难以满足不同领域研究的需要，特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型，为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料，对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练，构建多种用于识别典籍中动物命名实体的模型，并对这些模型进行识别性能测试，比较验证Siku BERT预训练模型的识别性能。结果表明，基于Siku BERT经训练所构建的动物命名实体识别模型效果最优，10折交叉测试的平均调和平均值（F1）为85.46%，最高一次达86.29%，应用于《史记》动物命名实体识别准确率达91.6%。

单位
南京农业大学; 南京师范大学

收藏分享被引浏览

更新时间：2023-02-06 03:09

数字人文视域下典籍动物命名实体识别研究——以Siku BERT为例

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友