面向科技人物简历的信息抽取方法

作者:杨永秀; 白宇*; 蔡东风; 何佳蔚
来源:计算机工程与设计, 2021, 42(11): 3099-3106.
DOI:10.16208/j.issn1000-7024.2021.11.013

摘要

为有效识别科技人物简历中研究领域信息,对部分时间和单位信息精准分类,提出一种基于字词协同的深度学习序列标注模型与梯度提升决策树模型相结合的科技人物简历信息抽取方法。利用字词协同的双向LSTM-CRF模型对科技人物简历文本进行初步解析,在此基础上使用梯度提升决策树模型实现对时间和单位信息的分类矫正。实验结果表明,该方法能够准确获取研究领域信息的关键特征,有效结合序列标注模型与分类模型的优点,对科技人物简历信息识别的F1值达到91.84%。