摘要
针对大数据时代,各业务评论数据的增长速度前所未有,阅读耗时且难以把握关键内容,数据普遍存在杂乱无章、内容量大以及价值信息难提取等问题。因此,提出基于评论数据的文本关键词提取和可视化方法。通过网络数据爬虫技术采集商业旅游网站景点评论数据,从Pythonjieba分词工具包里导入文本提取功能,再采用TextRank算法对景点评价词汇进行处理,提取热度关键词和权重值,最后经Echarts图进行展示,形成词云图,通过看图直接掌握文本重要内容,可节省大量的阅读时间。
-
单位山东电子职业技术学院