摘要

随着爬虫技术的蓬勃发展,互联网中诞生出了一系列刑事案件爬虫算法,但是这些算法都有一定的局限性,并且大量爬虫算法的诞生给网站后台服务器带来了极大压力。针对此,设计了一种新的算法,该算法可爬取刑事案情,并能对案情进行简单归类,以及对案情文本进行数据挖掘。本算法通过python语言编程实现,经过实际编码调试,验证表明:该算法具有便捷性,普遍适应性,避免反爬虫措施效果好,能完成数据的统计、分析及储存,且本算法不会对服务器造成压力,避免给网站造成任何经济损失。

  • 单位
    吕梁学院