摘要

本文探讨了科技文献中算法实体的自动识别研究,着重研究嵌套型算法实体的识别优化问题。首先通过远程监督学习的方式构建算法实体训练语料,再引入数据增强技术扩充语料规模,最后应用BartNER模型实现科技文献中嵌套算法实体的自动识别。实验结果显示,在引用数据增强技术的基础上BartNER模型取得了76.66%的F1值,证明该方法对嵌套算法实体识别的有效性,同时证明数据增强策略能够有效提升嵌套算法实体的识别效果。