摘要

目的 在算子、算力等资源有限的医院环境下,研究构建住院电子病历分型分类训练模型,实现病历检索、辅助诊断等下游应用推理,夯实病历智能化应用基础。方法 针对心血管疾病的智能诊疗需求,采用“预训练+微调”策略,通过研究数据预处理技术、病历对比学习方法,以及“医学领域训练、知识增强训练和任务相关训练”三阶段模型递进微调算法,在开源语言模型基础上,对约20万份住院病历进行训练,设计生成1个分型分类训练模型。结果 该模型可有效支撑下游应用,病历检索准确率达94.4%。结论 本文所提出的建模方法具有高效、安全等特点,对于病历检索、辅助诊断方面的应用具有参考价值。