一种基于web爬虫的网页信息获取系统

张洪豪; 赵泽宁; 姚世春

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种基于web爬虫的网页信息获取系统

作者：张洪豪; 赵泽宁; 姚世春

来源：中国科技信息, 2020, (06): 90-91.

摘要

<正>本设计实现了一种基于web爬虫的网页信息获取系统,通过构造虚拟HTTP请求头部,模拟浏览器行为发送虚拟请求获取需要的web页面,实现了流量包抓取、微信公众号内容抓取。通过实验结果和原网址信息进行比对,表明了网页信息获取系统的正确性。urllib2与Beautiful Soup简介urllib2在python3中即为urllib.request。由于urllib2

单位
天津理工大学

收藏分享被引(2) 浏览

更新时间：2024-04-14 18:01

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号