摘要
运用数据挖掘技术构建医案数据库是归纳和总结名医经验的常用方法。为了提升数据挖掘结果的使用价值,探讨现代名老中医医案数据库的构建方式,在优化数据库结构与常用字段的基础上,借助HanLP分词系统,应用结合最大概率算法的隐马尔可夫模型(HMM)分词算法进行医案文本的切分与语义标注,并通过python根据语义标注结果进行医案信息提取。该方法有助于优化医案数据结构,提升了数据库的构建效率和数据挖掘质量。
-
单位山东中医药大学附属医院; 山东中医药大学