摘要
针对机械工程领域缺乏标注语料问题,提出一种基于双重深度迁移学习的中文命名实体识别方法。该方法同时将迁移学习应用于预训练语言模型迁移和整体模型迁移,并结合机械工程领域知识进行微调,建立了双重深度迁移学习模型DT-BLC。以齿轮专利为例,利用统计学的方法对识别后的实体进行研究分析。实验结果表明,在小规模数据集上进行机械工程领域命名实体识别时,DT-BLC模型的精确率、召回率、F1分别达到88.98%、92.51%和90.71%,均优于其他模型,且对识别后的齿轮专利实体通过词频分析和新词发现获得齿轮的研究新信息。
- 单位