基于Scrapy框架的数据采集系统设计与实现

作者:郅芬香; 王留芳
来源:信息记录材料, 2020, 21(07): 130-132.
DOI:10.16009/j.cnki.cn13-1295/tq.2020.07.081

摘要

随着信息技术的不断发展,互联网已经迈入了大数据时代,如何高效地对海量信息数据进行抓取,分析和存储,已经成为当前研究的一个热点。本文使用Scrapy框架设计网络爬虫提取新闻报刊的标题、来源、链接地址、发布时间、正文等,详细介绍数据采集系统的设计与实现,该方法可以为数据分析项目提供数据采集及分析支持。

  • 单位
    鹤壁汽车工程职业学院