融合全文信息的科学数据正式引用识别方法研究

杨宁; 张志强

摘要

[目的/意义]科学数据已经成为数据驱动型科研的重要资料和产出成果，研究科学数据引用可以帮助追踪数据的使用状况、开展数据计量和评价、加速科研进程。[方法/过程]以生物信息学领域学术论文全文信息作为研究对象，利用规则抽取和人工标注形成了生物信息学引文分类数据集，对比评估6种深度学习模型与3种传统机器学习模型在数据集上的分类和识别效果。[结果/结论]实证研究效果显示，采用考虑语义和上下文特征的深度学习方法在科学数据正式引用识别任务中具有更优效果。[局限]未充分考虑数据类别不均衡问题。

单位
中国科学院大学; 中国科学院成都文献情报中心

收藏分享被引浏览

更新时间：2021-11-09 22:24

融合全文信息的科学数据正式引用识别方法研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友