摘要
【目的/意义】 针对医案不规范、不统一用语影响文本挖掘的效率和准确性的问题,以中医睡眠障碍医案为例进行术语规范化研究,提出构建中医医案语料库的方法,为机器理解医案提供规范的数据基础,进而提高中医知识挖掘的效率,推动中医隐性知识显性化。【方法/过程】收集大量睡眠障碍医案,参考国家标准从遣词用语的角度控制内容质量,选取科学、权威的医案作为研究基础;提取医案核心词语语料,对核心语料进行词形、词义和词间关系控制,确定并统计每一个语义下的首选术语和同义表述;最后,提出以中医诊疗逻辑为基础的医案语料库结构,将语料融入中医知识体系,构建了睡眠障碍医案语料库。【结果/结论】提出了中医专病医案的术语规范化的原则与流程,构建了中医睡眠障碍诊疗医案规范术语的对应语料库,为中医医案知识挖掘提供辅助,为新时代中医智慧化贡献力量。【创新/局限】提出在已有中医基础术语研究成果基础上,深入细分领域,对特定病症进行术语规范化和语料库构建的方法;本研究筛选出的医案数量有一定局限,望能够在未来研究中进一步丰富语料库内容。
- 单位