一种无需手工标注的半监督学习关键词抽取方法

蔡茂东; 沈国华; 黄志球

doi:10.20009/j.cnki.21-1106/TP.2022-0368

摘要

关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据集的前提上的，无法在低资源环境下快速运用.本文提出了一种考虑词频、词长以及词大小写特征的无监督算法以及结合了该无监督算法的自扩展迭代的半监督学习关键词抽取方法.半监督学习方法在同样无需手工标注关键词的前提下，相比无监督算法具有更高的F1值.

单位
工业和信息化部; 南京航空航天大学

全文

访问全文

收藏分享被引浏览

更新时间：2023-02-10 10:59

一种无需手工标注的半监督学习关键词抽取方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友