摘要
[目的/意义] 图书情报领域的知识计量研究长期停留在知识载体计量层面,难以深入挖掘细粒度的知识属性特征。试图从学术文献的文本片段层面开展知识单元粒度的知识计量研究。[方法/过程] 首先,提出基于“人工标注—规则归纳—机器识别—规则补充”流程的知识单元抽取方法;其次,通过该方法构建知识描述规则库,并抽取知识单元;最后,对知识单元的主题、结构等属性信息进行数理统计分析,得到知识单元在这些属性上的分布特征。[结果/结论] 基于“人工标注—规则归纳—机器识别—规则补充”流程构建的知识描述规则库收敛性较好,可以较为准确地从学术文献中提取知识单元文本片段。在此基础上进行的知识单元分布特征分析,能够较为准确地揭示文献知识单元在主题、结构上的分布特征,真正将知识计量的粒度从知识载体缩小至知识单元。
- 单位