摘要
本发明提供基于词共现的实体关系提取的控制方法,包括步骤:a.通过统计语料库中词语的共现频率计算词语相关度;b.根据所述词语相关度计算词语相似度;c.根据所述词语相似度确定实体关系。还提供相应的控制装置。本方法应用的语料库是新闻语料库,可以直接通过现有成熟的网页分析技术提取新闻正文和标题来构建语料库,不用太多人工参与去构建语料库,本方法应用自然语言处理中的浅语言规则如分词、词性标注和简单的统计技术便可以得到计算词语相关度时应用的词语频率,以及计算匹配相似度时考虑的词语位置、词语的词性和词语是不是动词等信息,将词语的语义信息和传统的模式匹配方法相结合。
- 单位