摘要
情报学领域的学术论文全文中包含了大量的方法实体,识别并分析这些方法实体可帮助学者更好地了解该学科,并找到适合自身研究工作的方法。从学术文献全文中自动抽取方法实体的基础是高质量的方法语料库,为此,文章提出了一种情报学方法实体标注框架,并在此基础上开展情报学方法语料库构建工作。具体而言,文章采取人工阅读和人工标注的方式,首先构建了情报学领域结构化学术文献全文语料,并在此基础上通过人工标注,识别出学术文献中包含情报学方法的句子和方法实体,得到情报学方法语料库。文章表明,文章提出的语料库构建框架可较好地完成语料实体的标注工作,其结果可作为基础数据库,为情报学方法实体的自动抽取提供训练数据。
-
单位南京理工大学; 经济管理学院