基于Web挖掘和文档对象模型树的XML网页分类方法

马勇; 郑翔; 鲜敏; 黎远松

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Web挖掘和文档对象模型树的XML网页分类方法

作者：马勇; 郑翔; 鲜敏; 黎远松

来源：微型电脑应用, 2016, 32(07): 47-52.

摘要

Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法。首先,收集XML网页的文本信息。然后,对XML文本进行去冗余操作,并提取网页源代码。再后,利用DOM树结构进行标签提取,创建知识库。最后,通过从测试网页中获取的标签与知识库进行匹配来分类网页。实验结果表明,提出的方法在各种XML网页下获得了97%的整体准确度。

单位
四川工程职业技术学院; 四川轻化工大学

收藏分享被引浏览

更新时间：2024-05-12 22:14

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号