摘要

随着网购用户规模的不断扩大,如何挖掘并利用商品的网页信息是当前重要的研究课题。为了充分利用网页信息为购买者提供更加优质的服务,要合理引入爬虫技术和数据挖掘方法,利用Python构建一个基于Scrapy框架的爬虫,将其存储于MySQL数据库,获取电商网页的数据信息,并对爬取的数据进行数据挖掘和提取分析,包括描述性分析和聚类分析等,深入全面地挖掘网页信息潜在的价值。

  • 单位
    福州墨尔本理工职业学院