基于Selenium框架的电力系统数据爬取应用研究

作者:余凯; 汤渊; 黎海震; 夏伟轩
来源:现代信息科技, 2020, 4(05): 26-31.
DOI:10.19850/j.cnki.2096-4706.2020.05.007

摘要

为了从大量数据中快速,高效地提取出有用的数据以方便数据分析。利用Python语言中的Selenium库是目前广泛应用于爬虫设计的一种方法,以其代码精简,拾取方便且效率较高等特点,应用于绝大部分企业的数据挖掘平台中。通过应用Python和Selenium的方法实现了数据的提取,并通过使用异常捕抓、函数封装,统一调用实现了数据的导出和上传的自动化,结果表明使用Selenium爬虫会优于网页爬虫。

  • 单位
    广东电网公司