摘要
[目的/意义]专利数据中包含大量的前沿技术信息,企业所拥有的专利可以用来衡量企业的技术创新能力。[方法/过程]本文选取Incopat专利数据库中与5G技术有关的专利数据,综合考虑专利价值的内部因素和外部因素,采用Logistic模型可视化国内外5G专利的技术生命周期,基于BERT模型对专利标题的文本语义信息进行特征提取,构建了包含专利技术特征、市场特征、法律特征、专利权人特征、文本语义特征在内的专利价值预测模型。分别采用传统机器学习模型(如随机森林、决策树、XGBoost等)和深度学习模型(如CNN、RNN等)进行训练和预测,基于SHAP解释方法分析专利价值预测模型中的特征重要性排序。[结果/结论]基于多特征融合的高价值专利预测模型的F1值达到0.894,优于其他的基线模型。在二级指标特征中,同族国家数的特征重要性最高;其次,公开国别、被引证次数在专利价值预测重要性较高。
- 单位