摘要

医疗信息化背景下,依托大数据的智慧医疗成为研究热点,而电子病历检索作为中医数据处理的基础操作,其性能直接影响到上层统计分析和挖掘应用的性能。目前中医电子病历采集和存储尚未形成统一标准,存在大量非结构化数据,基于传统关系型数据库的检索方式已不再适用。文章提出一种基于依存关系和倒排索引的中医电子病历高效检索方法,通过挖掘关键词之间的依存关系,使用二元组表示,并为二元组建立倒排索引以提高检索效率。该方法根据关键词之间的依存关系重构原文,创建倒排索引提高检索性能,保证海量数据的高效访问。