基于字词联合训练的Bi-LSTM中文电子病历命名实体识别

万里; 罗曜儒; 李智; 綦小蓉<sup>*</sup>

摘要

为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成。通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到最高准确率98.28%与最低复杂度1.169。该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础。

单位
四川大学; 四川大学华西第二医院

收藏分享被引浏览

更新时间：2024-04-10 02:54

基于字词联合训练的Bi-LSTM中文电子病历命名实体识别

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友