摘要

基于图的关键词提取中,关键短语提取阶段候选短语的评分方法易受单词的评分结果与短语长度的影响,为此提出一种结合短语频率信息与位置信息的评分方法。使用候选短语内含单词评分之和的平均值消除短语长度的影响,利用候选短语出现的次数与位置计算频率权重和位置权重,增强候选短语的最终得分。实验结果表明,提出方法在KDD、WWW、SIGIR数据集上的各项评估指标相对于传统的方法有明显的提升,验证了模型的有效性。