摘要

【目的】探讨全数据集、跨数据平台的语义知识图谱构建方法,开展基于知识图谱的药物知识发现研究。【方法】获取PubMed、DrugBank、CTD等数据库的知识关联,通过知识融合、属性定义构建语义知识图谱,以药物重定位为实证,采用路径搜索和链路预测两种方法推理药物在肿瘤治疗中的新用途。【结果】利用知识图谱能有效地进行药物发现,两种方法的总体预测效果相近,路径发现预测F值为0.57,略高于链路预测(0.56)。此外,药物与适应症之间存在的路径数越多,预测阳性的可能性越大。【局限】实证研究知识推理机制建立在已有知识关联基础上,难以对无靶点信息的新药进行挖掘;同时庞大的数据体量难以实现知识图谱的动态更新。【结论】融合多源数据集构建的知识图谱能有效地发现药物新适应症,提升药物研发效率,为药物知识发现提供新思路。