摘要
军事领域的文本数据集是在军事领域进行事件抽取的基础,高质量的数据集可以有效地推动军事领域事件抽取的研究,然而目前常用的事件抽取数据集(如ACE2005等)是面向通用领域的,关于军事领域事件的文本语料资源十分匮乏。因此,我们从公开军事新闻网站获取大量的军事新闻内容;在对新闻文本内容进行分析的基础上,首先建立包含事件类型、实体类型和实体关系类型的军事新闻事件模型;进而依据事件模型对文本数据进行人工标注,同时对事件模型进行迭代验证和修正;最终获得由13000条高质量军事新闻文本事件组成的标注种类全、质量高的军事新闻事件数据集。本研究公开了该军事新闻事件数据集。
- 单位