随着网络技术迅速发展,海量数据分布在万维网内,如何从数据中挖掘到特定的需要的数据成为时下研究的热点。网络爬虫是一种按照一定的规则,自动抓取万维网信息的程序或者脚本。本文探讨使用网络爬虫的概念和方法,开发基于互联网的聚焦网络爬虫软件,迅速通过互联网搜索山洪灾害点相关及时的第一手资料,形成对灾害的第一认识。再经过人工判读,精确动态提取、更新山洪灾害信息专题成果。