学术文献中的知识单元抽取及其分布特征识别研究

叶光辉; 彭泽; 陈国梁; 毕崇武

摘要

[目的/意义] 图书情报领域的知识计量研究长期停留在知识载体计量层面，难以深入挖掘细粒度的知识属性特征。试图从学术文献的文本片段层面开展知识单元粒度的知识计量研究。[方法/过程] 首先，提出基于“人工标注—规则归纳—机器识别—规则补充”流程的知识单元抽取方法；其次，通过该方法构建知识描述规则库，并抽取知识单元；最后，对知识单元的主题、结构等属性信息进行数理统计分析，得到知识单元在这些属性上的分布特征。[结果/结论] 基于“人工标注—规则归纳—机器识别—规则补充”流程构建的知识描述规则库收敛性较好，可以较为准确地从学术文献中提取知识单元文本片段。在此基础上进行的知识单元分布特征分析，能够较为准确地揭示文献知识单元在主题、结构上的分布特征，真正将知识计量的粒度从知识载体缩小至知识单元。

单位
华中师范大学; 郑州大学

收藏分享被引浏览

更新时间：2023-04-21 02:53

学术文献中的知识单元抽取及其分布特征识别研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友