基于命名实体识别的《神农本草经》知识图谱构建及可视化分析

作者:佟琳; 张华敏; 佟旭; 雷蕾; 王程; 曾子玲; 杨洪军*
来源:中国中医药信息杂志, 2023, 1-7.
DOI:10.19879/j.cnki.1005-5304.202305234

摘要

目的 构建《神农本草经》知识图谱,分析本草知识、挖掘隐性知识并进行可视化展示,为古籍研究提供方法学参考。方法 梳理并表述《神农本草经》文献涉及的知识实体类型和实体间关系,应用BIO序列标注方法生产训练语料数据集,使用自主研发的CNLP文本标注系统进行文本标注,采用BERT模型识别命名实体,基于规则与语义关联设定确定实体间关系,经知识融合后,用Cypher语言导入图数据库Neo4j-community4.4.9进行存储和可视化展示,构建知识图谱。结果 《神农本草经》知识图谱包含5 273个节点、11 064个关系,其模式层包含14种实体类、16种关系类型。可通过Cypher语言查询,从中药分类、药性理论、七情配伍、中药应用方面进行知识的可视化展示。结论 本研究构建的知识图谱可直观反映《神农本草经》所载知识及隐性关系,适用于中医药古籍的知识挖掘及直观多维展示。

全文