一种基于XML分析的Deep Web查询接口分类研究

作者:苟和平; 景永霞; 刘强
来源:南华大学学报(自然科学版), 2016, 30(02): 78-82.
DOI:10.3969/j.issn.1673-0062.2016.02.016

摘要

Deep Web查询接口分类是实现Deep Web在线数据库分类访问的主要方法,本文在研究查询接口特征数据抽取和表示的基础上,通过对查询接口所在Web页的位置来构建对应的接口特征XML文档,根据XML文档中的节点位置不同,分别为不同的查询接口特征赋予不同的分类权重因子,以提高有效特征的分类能力,并采用信息增益算法实现最终分类特征的选择,然后采用KNN分类算法实现查询接口分类,实验结果表明此方法的实际可行性.

全文