摘要
【目的】对PubMed收录的高证据疾病文献进行挖掘与知识发现,为疾病临床诊疗和日常防控提供借鉴。【方法】利用语义抽取工具SemRep,提出基于SPO语义三元组的疾病知识发现模型,选取糖尿病相关文献对模型进行验证,结合可视化及临床知识进行糖尿病知识发现。【结果】获得糖尿病SPO三元组1 258个,语义关系16个,揭示了糖尿病相关的基因、常见的并发症、检测手段及治疗方式。【局限】数据来源为公开发表的文献,未从知识库、电子病历等真实世界数据发现疾病知识。【结论】验证了基于SPO语义三元组的疾病知识发现模型用于揭示大规模文献中隐含的生物医学知识的可行性,有助于为生物医学科研人员提供潜在的研究假设和思路参考。
-
单位北京协和医学院; 中国医学科学院