摘要
心血管疾病长期以来一直占据着中国疾病死亡率榜首,并且其死亡率仍在逐年上升。在国内开源的中文医学数据集稀缺的背景下,结合自顶向下和自底向上的方法半自动化构建心脏病中文知识图谱。首先,基于高质量百科数据和医学文献构建心脏病本体,为了保证数据的领域封闭性,根据预先定义的疾病词典从百科类网站和医学网站等异构数据源中获取心血管疾病数据;接着,定义实体相似度计算方法进行更好的知识融合,并在图谱数据上通过模式发现寻找最优的数据模式,实现知识图谱模式层和数据层的共同迭代;最后,在图数据库中对图谱数据进行可视化展示,并根据当前研究动态探讨心脏病知识图谱一些具有前景的应用。
-
单位智能信息处理与实时工业系统湖北省重点实验室; 武汉科技大学