摘要
目的 针对中文医学病历文本,进行错别字智能纠错,以改善中文病历质量,减少诊疗文书差错产生的概率。方法 将统计语言模型和基于神经网的预训练模型相融合,进行中文病历文本错别字纠错的训练和验证,最终通过综合指标F1进行模型效果的评估。结果 实验结果显示,融合模型的中文病历错别字纠错F1为0.6254,优于单统计语言模型和单预训练模型的F1值0.4813和0.5970。结论 基于统计语言模型和预训练模型的融合方法,在中文病历文本错别字纠错方面有较好的效果,对临床病历书写质量的保障有一定的现实辅助意义。
- 单位