摘要
在自然语言处理领域中,电子医疗数据越来越多地与文本处理技术结合使用,以辅助医生进行诊断。但电子医学文本数据通常存在大量冗余、语义缺失、歧义等问题,导致基于特征提取的传统分类器不能充分发挥作用。针对上述问题,结合词向量法与深度学习理论,将医学文本中的数据和词表示为一个定长的矩阵,并利用改进LSTM模型与改进Yoon模型进行结合,整合成一个综合学习模型。最终,在实际医疗数据分类实验中验证了综合学习模型的有效性。实验与数据分析结果表明,对比改进后的LSTM模型与Yoon模型,综合学习模型在医学电子数据文本分类的准确率及精确度分别得到了较为明显的提高。
-
单位上海交通大学医学院附属新华医院