基于网络数据自动提取的爬虫设计与实现

张璐璐; 吴丽杰; 孙俊杰; 王星月

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于网络数据自动提取的爬虫设计与实现

作者：张璐璐; 吴丽杰; 孙俊杰; 王星月

来源：广州航海学院学报, 2022, 30(04): 74-78.

摘要

“互联网+”的兴起打破了数据信息的壁垒，网络爬虫被广泛应用于数据采集与数据分析中.以“豆瓣电影top250”为目标，采用基于Python语言的爬虫技术，对比BeautifulSoup、Re和Xpath 3种网页解析方式的不同，完成目标数据的爬取.实验结果表明：在数据解析速度上，Re最优；在网页解析逻辑上，BeautifulSoup最优；在综合使用角度上，Xpath较为适宜.

单位
安徽粮食工程职业学院

收藏分享被引(1) 浏览

更新时间：2024-03-20 01:03

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号