摘要
非结构化电子病历采用自然文本录入,系统无法自动识别,不易进行特征抓取与统计查询,本文利用循环神经网络算法,采用Bi-LSTM-CRF模型训练与迭代学习,最终获得6万个术语及上千种常见句式,并在此基础上继续挖掘更多的实体与实体关系,完成电子病历的后结构化转换。神经网络在电子病历后结构化转换过程中的应用前景广泛,但现阶段受病历书写不规范、中文语义复杂等因素影响,数据抓取准确性仍有待提高。随着人工智能以及算法的不断改进,神经网络在电子病历后结构化方面的普及应用指日可待。
-
单位首都医科大学附属北京妇产医院