摘要

研究方法是科技文献中的重要内容,是解决学科领域问题的方法、工具、手段或技术。研究方法的描述通常以句子为单位。将分散在科技文献中的研究方法句进行汇总,可以辅助科研工作者快速地搜寻合适的研究方法。根据方法使用主体,将研究方法句进一步分为论文使用方法句和论文引用方法句。论文使用方法句是指论文中使用的研究方法的描述句。论文引用方法句是指论文对前人使用过的研究方法的描述句。本文使用多种基于神经网络的句子分类模型从科技文献全文本中进行研究方法句抽取。在模型词向量表示层,论文使用BERT和word2vec两种词向量模型。在模型的特征选择层,本文选用三种不同的网络,分别为卷积神经网络、双向长短时记忆网络和注意力机制网络。另外,论文使用两种模型训练方式,分别为单层次结构和两层次结构。实验结果表明,基于BERT的单层次结构的双向长短时记忆网络模型取得了较优的性能。本文从《情报学报》已发表论文中进行研究方法句的抽取并分析研究方法句的分布情况。分析发现,《情报学报》逐渐重视情报学中理论的发展并关注建设情报学学科的理论体系。