摘要
台风事件信息抽取在台风知识检索、灾害应急预警、损失评估预测等方面具有重要价值。由于台风事件存在一个时空动态演变的过程,新闻文本中易出现包括台风形成、登陆、移动和消散等不同时间节点的事件状态的混合表达,使得规则匹配和现有传统机器学习方法进行信息抽取效果不佳。因此,提出一种结合事件和语境特征的台风事件抽取方法,能够充分考虑词汇的事件特征和上下文信息。实验结果显示所提出的方法使得登陆时间和登陆位置抽取准确率高达92%,各事件元素抽取精度总体较高且较为平衡,平均F1值高达78%,提升幅度达42%。本文研究为构建台风知识库提供了方法支撑。
- 单位