摘要
为了从海量文档中检测出特定事件,提出了一种跨文档事件检测的模型和算法。首先从文档中提取信息要素,包括主体、时间、地点、主题。然后以信息要素为基础对文档建立共现词网络图,并采用4W向量描述待检测事件,即从逆向的角度考虑,对共现词网络图进行带约束条件的深度优先搜索,寻找图中定长的环。最后判断这些环中的节点是否包含待检测事件的信息要素以实现事件的检测,并以环中节点反向获得与事件相关联的文档。实验表明该算法能从文档库中检测出事件,与其他算法相比,能同时获得较高的准确率和召回率。
-
单位西北工业大学; 成都飞机工业(集团)有限责任公司; 成都飞机工业(集团)有限责任公司