基于Lattice LSTM的古汉语命名实体识别

崔丹丹; 刘秀磊; 陈若愚<sup>*</sup>; 刘旭红; 李臻; 齐林

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Lattice LSTM的古汉语命名实体识别

作者：崔丹丹; 刘秀磊; 陈若愚^*; 刘旭红; 李臻; 齐林

来源：计算机科学, 2020, S2: 18-22.

摘要

基于《四库全书》数据集,研究古汉语的命名实体识别技术。提出了基于Lattice LSTM模型的古汉语命名实体识别算法,该方法将字符序列信息和词序列信息共同作为模型的输入。采用甲言(jiayan)分词工具,利用word2vec训练古文字、词向量并作为Lattice LSTM模型的输入,提升了古汉语命名实体识别的效果。基于Lattice LSTM模型和预训练的古文字、词向量,提高了古汉语的实体识别效果,相比传统的BiLSTM-CRF模型,其F1分数提升3.95%左右。

单位
北京信息科技大学

收藏分享被引(29) 浏览

更新时间：2024-04-13 01:44

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号