摘要

自新型冠状病毒疫情发生以来,全国有400多个城市通过多种渠道公布了包括确诊病例、疑似病例和无症状病例的住址或逗留场所等具体位置信息.这些信息不仅是公众的关注焦点,对防控工作也具有重要意义.以往这些信息的获取主要以人工方式为主,效率低下,缺乏时效性.针对这一现状,本文应用相关的自然语言处理方法分析疫情通报信息,构建疫情新闻信息提取系统.借助现有的NLP工具包和百度地图开发平台,结合疫情新闻的文本特点,设计相关规则,对疫情新闻网页中的文本进行分析,并提取3个方面的信息:病例的路线信息、居住地信息和交通搭乘信息.