摘要

目的:利用MeSH组配规则自动抽取文摘中表达特定语义关系的句子,为制定自然语言处理关系抽取模板以及句子水平的信息检索提供依据。方法:根据主题词组配规则,使用python语言从文摘数据中匹配出含有特定MeSH主题词概念的候选关系句,从中抽取出以描述概念间关系的短语或句子。邀请专家对100条候选关系句进行概念间语义关系人工标注,将得到的语义关系三元组作为评价金标准,与自动抽取出的概念间关系进行对比分析。将自动抽取的结果加以整理形成特定概念之间的语义关系表达。结果:对大量的自然文本句进行句法分析,批量识别出2个特定概念间语义关系抽取方法的准确率为87%,召回率为62%,F1=71.8%。结论:利用MeSH组配规则抽取表达特定语义关系句子的方法具有较高的准确率与召回率,对生物医学文本理解及医学知识发现等具有借鉴意义。