基于K-means算法的专利数据分析

作者:薛淑晖; 王丽; 吴海涛
来源:现代信息科技, 2020, 4(05): 85-89.
DOI:10.19850/j.cnki.2096-4706.2020.05.025

摘要

专利信息作为目前国际知识产权中科技含量最高的存在,是国家和企业获取竞争优势最全面的技术情报来源。使用专利数据网的数据信息作为测试数据,采用K-means算法,针对专利文本数据进行聚类分析,旨在找出隐含在专利数据信息中不容易被直观发现或直接统计得出的数据情报信息。通过深入挖掘专利信息,提高专利信息利用率,使之转换为具有实际价值的情报信息,有效解决了对专利信息利用不足的问题。