摘要

本文基于通用数据资源(科技文献、科研活动等)和专业领域知识资源(如组学科研数据),以水稻粒型基因领域为例,探索具有一定普适性,能兼顾知识覆盖广度和深度(全景式),并可充分继承整合多源异构数据和知识(多路径)的领域知识图谱构建方法。首先,继承复用权威学术论文中专家先验知识和多种领域本体,自顶向下设计构建全景式水稻粒型基因知识图谱模式层的本体模型;其次,通过图数据抽取、结构化及半结构化转换映射和非结构化文本抽取等多路径实现图谱数据实例填充,并基于数据挖掘发现的新实体及其语义关系,进行自底向上的本体模型迭代完善;再次,通过实体消歧、实体链接等实现多源知识关联融合,并基于Neo4j数据库实现图谱数据持久化存储;最后,对领域知识图谱驱动下的典型知识关联与发现服务应用场景进行展望。实验结果表明,本文研究提出的全景式、多路径领域知识图谱构建方法,具有一定集成性和通用性,可为细分垂直领域的知识图谱构建提供参考。