摘要

随着人工智能和大数据的蓬勃发展,传统的现场购物的方式已经被颠覆,电子购物逐渐成为人们生活不可或缺的一部分。电子购物不仅方便了消费者,而且电商平台也可以获得海量的非结构化文本数据,如商品描述、用户评论、用户咨询等,进而实现商品优化。但是电商平台所获得的信息繁冗复杂,数据量大且夹杂大量无效信息,如何从其中高效提取有效信息成为电商平台发展的掣肘所在。基于这一关键问题,一种全新的数据挖掘系统被提出。以某知化妆品为案例,通过Python爬取其购物评论,利用WordCloud制作词云,从词云图捕捉客户对商品的满意度以及客户对商品的主要关注点。随后基于朴素贝叶斯分类算法对评论进行类别训练,并提取好差评评论中的敏感词汇,进而找到商品改进的突破点。