摘要

数据采集是数据分析的起点,采集数据的准确性和完整性直接决定数据分析的质量。以爬取实际门户网站数据为例,探索高效完成门户网站网页数据采集的基本思路和常规采集方案,最终实现数据采集的网络爬虫。实验结果表明该方案能高效完成门户网站网页数据采集,可满足常规门户网站的网页数据采集需求。

  • 单位
    河南财政金融学院