基于预期剩余能量模型的聚焦爬行方法

尹文科; 宗士强; 王珩

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于预期剩余能量模型的聚焦爬行方法

作者：尹文科; 宗士强; 王珩

来源：计算机工程与应用, 2015, 51(24): 120-158.

摘要

如何确定搜索的方向和深度是聚焦爬行的核心问题。为此,提出了链接的预期剩余能量概念及其计算方法。该方法利用当前页面的信息计算链接的立即回报能量,利用到达同一链接不同历史路径给予的历史回报知识不断迭代更新链接的预期剩余能量。利用预期剩余能量作为链接的优先级和搜索深度限制,设计了基于预期剩余能量模型的聚焦爬行算法,并给出了关键模块的实现。实验结果显示该方法具有更强的主题网站发现能力。

单位
中国电子科技集团公司第二十八研究所

收藏分享被引浏览

更新时间：2024-05-14 21:48

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号