摘要
针对维吾尔语命名实体识别中存在的语义信息欠缺及其数据稀疏等问题,提出一种基于深度神经网络的维吾尔语命名实体识别方法。基于BiLSTM-CNN神经网络架构得到初步的实体识别结果。为缓解神经网络方法中存在的数据稀疏问题,提出双语实体词映射特征及其词聚类特征,分别将资源丰富语言实体词识别知识及其大规模维吾尔语单语知识引入到一个基于对数线性模型的后处理模块中。实验结果表明,该方法在维吾尔语命名实体识别性能上优于现有模型,识别F1值提升大于3%。
-
单位浙江医药高等专科学校