摘要

科技的发展使得数据量呈爆炸式增长,从数据中挖掘有价值的信息成为各行业研究的热点。旅游景点类型的准确划分,对于推动文化旅游产业发展具有重要意义。对此,论文融合景点评论构建景点异质信息网络,提出了SGAE(Scenic Spot Heterogeneous Graph Attention Embedding)模型。首先,从旅游网站和百科网站爬取国内部分5A和部分4A景点的描述以及景点的评论数据,通过对数据的处理和分析,从评论中挖掘出10个相关主题,构建由景点名称、景点评论和评论主题组成的异质信息网络;其次,将不同类型节点信息映射到同一空间,构造异质图卷积的逐层传播规则;然后,根据邻居节点的类型和节点的不同对某一具体节点的影响不同,将双层注意力引入异质图卷积网络中,提出SGAE模型,学习景点名称的低维特征表示,通过Softmax函数进行归一化,确定景点类型;最后,在景点数据集上与经典分类算法对比,所提出的SGAE模型在准确率和F1值较当前最优方法分别提高5%和4%,在公共数据集AGNews和MR上SGAE模型性能优于所有对比模型,且与分类效果最好的HGCN-RN模型相比,SGAE在AGNews上准确率和F1值分别提升了1.95%和1.98%,在MR上准确率和F1值分别提升了3.92%和6.96%,充分验证了论文所提算法在分类任务上的有效性。总之,针对景点分类问题,论文所提出的SGAE模型有效的提高了旅游景点分类问题的效果,具有较好的应用前景。