摘要

涉恐情报应用的核心是预警,识别涉恐实体是实现恐怖风险预警的前提.机器学习在多个领域中优异表现,因此基于机器学习的涉恐实体识别得到了众多研究者的关注.以全球恐怖主义数据库为研究对象,提出一种端到端的不依赖人工特征选择和领域知识的涉恐实体识别模型.模型基于谷歌BERT预训练语言模型及预训练字嵌入向量,融合BiLSTM网络和CRF实现语句的上下文关联语义分析及语法结构约束.结果表明,基于BERT-BiLSTM-CRF的涉恐实体识别模型的召回率高达90%以上,性能优于传统的循环神经网络模型和CRF模型,能有效获取涉恐组织、暴恐发生地点等重要信息.

  • 单位
    大连外国语大学; 辽宁警察学院