介绍了一种新的网页结构化抓取的方法。该方法一种通用的网页数据抓取方法,在得到数据的同时,也保留数据原先的结构。本方法在获取网页数据的同时,最大化地保留了数据源原本的结构,从而能够组织成结构化数据,方便后续的存储、查看和使用。