摘要
[目的/意义]旨在为提升藏文文本关键词的抽取效果提供参考。[方法/过程]分析中英文文本关键词抽取方法的特点和存在问题,针对藏文文本特点,提出一种融合多特征的TextRank关键词抽取方法,通过实验获取不同特征的相对最优权重系数,并将权值计算公式应用于TextRank的初始权值与转移概率的计算中。[结果/结论]该方法通过融合藏文文本的结构特征以及词语之间语法关系等关键词提取影响因素,实现了候选关键词的量化权值,相比于传统方法关键词抽取效果有明显提升,同时证明融合结构特征与语法特征能有效改善TextRank算法的性能。
-
单位西藏民族大学