摘要

目的/意义 挖掘在线医院的医疗特色对在线医疗推荐具有重要作用。当前,虽然部分在线医院具备特色标注功能,但只能实现医院内部特色提示,无法从全局角度衡量不同医院之间的特色差异。方法/过程 提出一种基于在线医院问诊文本的医院特色识别模型(hospital special medical based LDA, HSM_LDA)。该模型以医院ID为文本划分依据,将语料库中的“文本-词汇”矩阵转换成“医院-词汇”矩阵,联合建模医院、主题、词汇3个变量,生成“医院-主题”(E)和“主题-词汇”(F)两个分布。最终结合E和F两个分布识别出每个医院的医疗特色。结果/结论 以“好大夫在线”平台中的医院问诊文本作为实验数据集,运用HSM_LDA模型进行特色挖掘分析,识别精度为87%,效果良好。