摘要

<正>本文概述了Web结构挖掘技术,列举其常见算法。并对关联规则和聚类两种最重要的Web结构挖掘算法分析。设计了一种Web结构挖掘算法模拟器,实现结果表明其具有一定的实用价值。Web结构挖掘是通过研究网页之间的链接结构来发现网络的组织结构和链接关系中隐藏的知识。随着互联网的迅猛发展和快速普及,Web上蕴藏的海量信息为数据挖掘提供了无比丰富的资源。其中,Web结构挖掘主要是从Web组织结构和链接关系中推导信息、知识。