摘要
本发明公开了一种面向教育考试的跨域图匹配实体识别方法,步骤如下:获取源域命名实体识别数据集,使用源域命名实体识别数据集训练深度神经网络模型得到源域模型;获取带有实体类别标注的教育考试文本数据;利用训练好的源域模型构建目标域模型;把教育考试文本数据输入源域模型和目标域模型分别计算得到源域图和目标域图;利用教育考试文本数据、源域图和目标域图训练目标域模型,训练完成的目标域模型可用于教育考试文本实体识别。该方法利用迁移学习的优势,把模型在数据充足的任务下学习到的知识有效地迁移到带实体类别标注数据较为稀缺的教育考试文本实体识别任务中,提升了对教育考试文本实体识别的准确率。
- 单位