摘要
专利是授予发明者在一定时期内保护其发明的法定权利,在当今的人工创新中发挥着重要作用。现有的研究工作并没有针对专利相似度数据进行适配优化,导致其应用在专利短语相似度匹配任务上效果不佳。先前的研究表明,在低资源的场景下,提示学习将文本片段(即模板)插入到输入中,将分类问题转换为掩码语言建模问题,其关键的一步是在标签空间和标签词空间之间构造一个投影。本文提出一种基于知识注入的提示学习方法,将其应用于专利短语相似度匹配计算。为了解决专利短语的信息不足的问题,本文利用专利短语中的相似程度标签信息,使用知识增强专利短语与标签信息。本文首先通过实体链接技术建立专利短语与外部知识的关联关系。然后,本文设计了一种基于实体影响度的邻域信息过滤机制,用于扩充专利短语信息不足的问题。最后,考虑不同外部知识对专利短语相似度计算的影响,本文设计了应用于专利短语的多种增强提示文本。实验结果表明,对比现有的方法,该方法的Pearson和Spearman分别提升6.8%和5.7%。
- 单位