基于BLSTM-CRF中文领域命名实体识别框架设计

作者:张俊飞*; 毕志升; 王静; 吴小玲
来源:计算技术与自动化, 2019, 38(03): 117-121.
DOI:10.16339/j.cnki.jsjsyzdh.201903023

摘要

为在不依赖特征工程的情况下提高中文领域命名实体识别性能,构建了BLSTM-CRF神经网络模型。首先利用CBOW模型对1998年1月至6月人民日报语料进行负采样递归训练,生成低维度稠密字向量表,以供查询需要;然后基于Boson命名实体语料,查询字向量表形成字向量,并利用Jieba分词获取语料中字的信息特征向量;最后组合字向量和字信息特征向量,输入到BLSTM-CRF深层神经网络中。实验结果证明,该模型面向中文领域命名实体能够较好的进行识别,F1值达到91.86%。

全文