摘要
网络安全形势日益严峻,从威胁情报中抽取网络安全实体及其关系,构建结构化威胁情报信息,对于网络安全从业人员来说尤为重要。过去的工作主要利用基于特征的模型来完成,不仅耗时,还需要完成大量的特征工程任务,为威胁情报信息抽取研究带来巨大的挑战。基于上述情况,为了降低任务对特征工程的需求,提出一个基于神经网络模型的威胁情报信息抽取方法(TIIE),一方面,采用长短时记忆神经网络(LSTM)进行命名实体识别任务,并利用条件随机场(CRF)模型实现序列标签之间的约束性;另一方面,结合长短时记忆神经网络模型和最短依赖路径(SDP)方法进行关系抽取任务。最后,比较TIIE和其他威胁情报信息抽取方法在命名实体识别和关系抽取领域的效果,实验结果显示,TIIE方法在进行较少特征工程的情况下具有更好的表现。
- 单位