摘要

针对当前网络安全领域知识获取中所依赖的流水线模式存在实体识别错误的传播,未考虑实体识别与关系抽取任务间的联系,以及模型训练缺乏标签语料的问题,提出一种融合对抗主动学习的端到端网络安全知识三元组抽取方法。首先,将实体识别与关系抽取通过联合标注策略建模为序列标注任务;然后,设计融合动态注意力机制的Bi LSTM-LSTM模型实现实体与关系的联合抽取,并形成三元组;最后,基于对抗网络训练一个判别器模型,增量地筛选出高质量的待标注数据进行标注,并通过迭代训练不断提升联合抽取模型的性能。通过实验表明,所提方案中实体-关系联合抽取模型优于现有的网络安全知识抽取方案,并验证了对抗主动学习方法的有效性。

  • 单位
    信息工程大学