摘要
Web信息访问的有效监控已成为保证网络安全的重要部分,提出基于关键词分级检索的Web信息访问监控算法。充分考虑词汇链长度、词汇链中词汇分布密度等因素计算所搜寻词语与初始词汇链相似度,依据相似度结果构建词汇链,基于词汇的首次出现位置、所处文档区域、所处词汇链强度、词汇信息熵四种属性确定文档中词汇权值,降序排列词汇链内全部词汇权值,依次选取权值较大的词汇作为关键词,根据所确定关键词实现关键词分级检索Web信息,利用PageRank算法获取Web页面重要程度排序Web网页超链接,依据超链接排序结果确定监控周期实现Web信息访问监控。实验结果表明,该算法可通过分级检索关键词实现Web信息访问有效监控,监控有效率高于99%,监控误报率低于1%,可有效提升网络访问安全性。
- 单位