摘要

目的:帮助人们更好地利用领域关键词挖掘和分析领域特征,解决领域关键词提取技术面临的领域语料信息冗余且分布不均衡的问题。方法:提出二次关键词提取策略,并结合词向量模型和聚类算法构建领域的局部热词模型。结果:得到了领域的热词和热词频率分布、特征划分及其分布图。结论:旅游评论挖掘的结果表明该方法能够有效提取领域特征,实现领域特征可视化,降低领域语料分布不平衡的负面影响。