摘要

一种好的智能搜索算法对智能Web应用是非常重要的。为了在智能Web应用中实现快速智能搜索且能有效地去除垃圾信息,首先介绍了Lucene开源系统,详细分析了Lucene的系统结构以及PageRank算法。按照Lucene的框架规范,将Lucene很好地嵌入到自己的搜索引擎中,利用爬虫从互联网上收集数据,使用目前流行的Lucene和PageRank搜索技术在收集的数据上进行了实例研究。研究表明若在Lucene搜索中添加PageRank分数,进行混合搜索排序时,相关性高的网页就会排到前面,从而有效提高在智能Web中搜索的准确率及效率。