摘要

文献计量过程中,高频词选择决定共词分析结果,因此高频词阈值计算方法极为重要。文章以近二十年国内高校信息素养教育研究成果为样本数据,进行基于齐普夫定律的高低频词界分法、普赖斯定律公式法、二八定律法、自定义法、g指数法等五种阈值计算方法的计算,并对其聚类效果进行对比分析。结果发现,五种方法中,词频g指数法聚类效果最好,其他几种方法均不具有普及性和通用性,但在实际的关键词分析中,还应根据具体研究对象和研究目的,选择合适的高频词取词法。