一种网页结构化数据的抓取方法

作者:薛春艳
来源:现代工业经济和信息化, 2021, 11(10): 191-192.
DOI:10.16525/j.cnki.14-1362/n.2021.10.075

摘要

介绍了一种新的网页结构化抓取的方法。该方法一种通用的网页数据抓取方法,在得到数据的同时,也保留数据原先的结构。本方法在获取网页数据的同时,最大化地保留了数据源原本的结构,从而能够组织成结构化数据,方便后续的存储、查看和使用。

  • 单位
    厦门大学嘉庚学院