摘要

爬虫是一类收集信息的自动化程序,当前越来越多的领域都在使用爬虫收集目标信息。由于Python具有可快速迭代的特性,在主要内容为图像处理与人工智能的医学影像中得到了广泛的应用。为了在保证程序运行效率的同时,减轻训练模型所需数据为计算机存储带来的压力,采用了能够大幅提高程序运行效率的异步式程序,并使用暂态文件保存数据。结果表明,异步式程序、暂态存储程序的运行效率分别是单线程的4.722倍、1.433倍,在医学影像模型训练中使用爬虫可以降低对计算机存储性能的要求。