摘要

[目的]构建一种高效的科技文献摘要结构要素识别模型,实现对一段式摘要的结构要素识别。 [方法]以知识增强语义表示模型(Enhanced Representation through Knowledge Integration,ERNIE)对科技文献的摘要文本进行表征,通过深度金字塔卷积神经网络(Deep Pyramid Convolutional Neural Networks,DPCNN)进行文本特征抽取,构建科技文献摘要结构要素识别模型。 [结果]所构建的模型在图书情报领域数据集上识别文献摘要结构要素的精确率、召回率、F1值均高于0.95,比基准模型具有更好的识别性能。 [局限]使用的语料具有一定的领域倾向,模型的领域通用性还有待验证。 [结论]构建的模型可以更好的对文本特征进行抽取,有效提升了科技文献摘要结构要素的识别性能。