从大量中文病历文献中提取出重要的疾病主题,对医疗工作者学习和科研是非常重要的。为了更方便的提取出主题,本文提出结合中文分词技术与FP-Growth算法的一种方法模型。该模型可以在大量中文病历文献中,首先将病历文献划分为若干关键词组成的项目集文档,再使用FP-Growth算法,计算关键词的频繁项集,并生成病理字典,最后提取出文本的疾病主题。