摘要
[目的]解决传统单分类方法无法有效识别高质量“卡脖子”技术专利的问题。[方法]本文以申请文件为研究主体,组合LSTM、Word2Vec及BERT得到多分类轮询的高质量“卡脖子”专利识别模型LSTM-Seq-BERT,并以IPC号为一级分类标签、授权状态为二级分类标签构建了与模型对应的多级标签体系。[结果]将对高质量“卡脖子”技术专利的识别精准度提高至88.1%。[局限] 仅使用粤港澳大湾区专利,存在数据不平衡情况。[结论]本文构建的二级分类标签和轮询机制的模型提高对高质量“卡脖子”技术专利的识别准确率,具有实际应用价值。
-
单位哈尔滨工业大学; 哈尔滨工业大学(深圳); 经济管理学院