摘要

细分领域实体关系的获取是知识工程深化与泛化应用的关键问题,当前面临对人工标注语料严重依赖这一核心难题,一种自然的解决思路是利用细分领域已有的(或可低成本获取的)知识库作为指导。与通用型知识库不同,细分领域知识库往往规模较小,因此不仅要利用其中的现成知识内容,还有必要充分发掘蕴含于领域知识库中规律性的"领域元知识"。本文提出一种融合领域元知识和词嵌入向量类比的细分领域实体关系发现方案:首先,根据已有知识库抽象出特定细分领域的实体关系约束条件,如症状表征关系由<疾病,症状>实体对构成;其次,依据相应领域语料计算领域实体的词嵌入向量;随后,针对知识库中少量高质实体关系学习各类关系词嵌入类比的正负例向量基准,以此为基础训练实体关系分类器;最后,针对给定的领域实体,综合关系约束、词嵌入相似度、词嵌入类比结果分类,得到与其构成不同类型关系的实体。以心血管领域数据为例,仅用少量从百科抽取的领域知识,即可取得较好的实体关系识别效果。