摘要

近几年,随着大数据、人工智能快速发展,Python呈现出爆发式的增长。伴随着移动互联网的快速发展,越来越多的人选择线上阅读,词云是一种新的可视化方式,能够准确快速地筛选出重要文本信息,把关键字以图片的形式展现出来,帮助广大读者快速地进行阅读前的筛选。该文主要介绍了基于Python的词云生成。以豆瓣网中柴静《看见》一书的书评为例,尝试对此书评进行词云生成。首先通过中文组件jieba进行分词,然后用TF-IDF算法提取关键词,最后利用wordcloud制作出词云图。

  • 单位
    辽宁对外经贸学院