摘要
本发明公开了一种基于对抗多任务学习的医疗咨询命名实体识别方法。所述方法包括以下步骤:采集医疗咨询数据,对医疗咨询数据进行预处理,并对其中一部分数据进行实体的标注,得到有标注的医疗咨询数据;构建双向语言模型和掩码语言模型,利用无标注的医疗咨询数据,分别预训练双向语言模型和掩码语言模型;将双向语言模型和掩码语言模型的预训练特征引入到命名实体识别模型;对命名实体识别模型进行对抗多任务训练,得到训练好的命名实体识别模型;输入一段文本到训练好的命名实体识别模型的目标标注模型中,实现文本命名实体识别。本发明引入了迁移学习、对抗学习、多任务学习等技术,有效地提高了医疗咨询文本命名实体识别的效果。
- 单位