摘要
病情在线咨询中的陈述内容形式一般比较自由,文章的目的是从这些自由形式的文本中挖掘与疾病有关的隐藏信息和用户目的,所以提出一种通过无监督学习构建知识图谱然后进行病情辅助诊别的方法。首先根据同种疾病的病情陈述文本进行特征提取,并使用图计算的方法构建特征关联网络。然后根据在该网络中发现的病情陈述常用特征词团之间的相互语义关系建立知识图谱;并从知识图谱上抽取结构化特征,利用抽取的特征与病情陈述文本的Jaccard相似性系数实现文本的结构化表示。最后利用支持向量机实现病情陈述的分类识别,结果分类的微平均和宏平均都在80%以上。本文研究能够用于相关疾病的知识挖掘和病人的目的分析,初步诊别病情陈述的疾病类型。
- 单位