摘要

针对传统基于规则的简历实体提取方法效率低、迁移能力差的问题,提出了一种基于Transformer双向编码器表示(bidirectional encoder representations from Transformers, BERT)的深度学习模型,用于识别相关命名实体。模型通过BERT对简历信息进行字符级别编码,得到基于上下文信息的字向量,通过双向长短时记忆(bidirectional long short term memory, BiLSTM)网络对生成的字向量进行特征提取,将所有可能的标签序列打分输出给条件随机场(condition random field, CRF),最终通过CRF进行解码生成实体标签序列。实验结果表明,BERT-BiLSTM-CRF模型对简历实体识别的效果优于其他传统模型,取得了最高的F1值为94.82%。