摘要
[目的/意义]由于中文字符语义较为复杂、上下文信息关联较紧密,因此中文命名实体识别难度较大。基于此,提出一种深度学习方法,有效识别涉恐信息实体。[方法/过程]以反恐怖主义信息网获取的全球恐怖主义报道为实验数据集,利用BiLSTM网络完成语句的上下文关联语义分析并初步预测标注,后接入特征强调的CRF层依据语法结构添加约束,确保标签预测值的准确性并得到词性标注结果,实现了涉恐信息实体识别。[结果/结论]基于BiLSTM网络与BiLSTM-CRF进行两组对比实验,结果表明,基于BiLSTM-CRF的涉恐信息实体识别模型准确率与召回率均高达90%以上,能有效获取涉恐人员、恐怖主义机构及暴恐实施地点等重要信息。
- 单位