Deep Web查询接口的自动判定

作者:高岭; 赵朋朋; 崔志明
来源:计算机技术与发展, 2007, (05): 148-151.
DOI:10.3969/j.issn.1673-629X.2007.05.044

摘要

传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。

全文