海量文本疾病主题自动提取研究

作者:王明令; 纪怀猛; 吴春琼
来源:数字技术与应用, 2019, 37(05): 74-75.
DOI:10.19695/j.cnki.cn12-1369.2019.05.38

摘要

从大量中文病历文献中提取出重要的疾病主题,对医疗工作者学习和科研是非常重要的。为了更方便的提取出主题,本文提出结合中文分词技术与FP-Growth算法的一种方法模型。该模型可以在大量中文病历文献中,首先将病历文献划分为若干关键词组成的项目集文档,再使用FP-Growth算法,计算关键词的频繁项集,并生成病理字典,最后提取出文本的疾病主题。

  • 单位
    阳光学院

全文