核心专利集筛选及专利技术主题识别影响

作者:李姝影; 张鑫; 许轶; 许海云; 张娴; 朱月仙
来源:情报学报, 2019, 38(01): 13-20.
DOI:10.3772/j.issn.1000-0135.2019.01.002

摘要

领域重要的技术特征词在技术主题网络中具有关键核心作用,研究对比从核心专利数据集中抽取的技术特征词相对于全数据集的效率,进而探讨基于引文网络的核心专利集筛选策略对技术主题识别所产生的影响。本文借鉴了专利引用强度指标和引用滞后性特征对核心专利集进行两步筛选,研究对比核心专利集与全数据集抽取的主题特征词在词云规模、词频覆盖率、阈值选择以及技术主题划分的差异。实证分析发现,利用核心专利集抽取技术特征词有助于提升技术主题识别的效率和准确性,且基于核心专利集聚类生成的技术主题网络与领域全集的主题覆盖率较大,能够有效简化技术网络中的技术主题,更加便于专家对技术主题进行归纳与总结。

全文