摘要

[目的/意义]针对领域学术文献,基于题录信息构建按照"研究内容"与"研究方法"的双标签分类模型,为学术文献的细粒度分类提供方法借鉴。[方法/过程]以深度学习中卷积神经网络为基础模型,将题名、摘要、关键词、刊名、作者、机构等题录信息分为显性特征和隐性特征,通过显性特征提取、隐性特征映射等步骤,形成特征词数组,在此基础上生成词向量矩阵,经过卷积层、池化层与Softmax层处理,完成分类任务。[结果/结论]以电子商务领域文献为例进行实验验证,结果显示,该模型按"研究内容"与"研究方法"双标签分类的宏F1值分别为0.74、0.81,不仅明显优于传统机器学习方法,也比仅使用显性特征的深度学习分类方法高。

全文