摘要

数字资源凭借获取较为便捷的特点已成为文献查找和资料研究的重要信息获取来源,但是数字资源的获取受网络状态的限制,为了保障数字资源的正常工作,设计数字资源检测软件,提出基于网络爬虫的数字资源检测软件设计。构建数字资源检测软件总体框架,在总框架的基础上进行网络爬虫技术软件设计。设计信息采集模块,保证网络爬虫可以复制所有的数字资源,在此基础上进行可视化信息抽取,保障在需要信息时可以随时调用,通过爬虫技术实现数字资源的最终检测。在相同的硬件环境中,利用基于网络爬虫的数字资源检测软件和传统的人工检测方法、自研检测软件进行信息抓取实验,实验结果证明基于网络爬虫的数字资源检测软件单位时间内的信息抓取量最高。