摘要

Lucene是一个优秀的开源的全文搜索技术框架,按照框架规范,扩展它的功能,可以将它很好地嵌入到搜索引擎中。研究了Lucene的索引结构和原理,通过改进增量索引、增大索引缓冲区的大小和减少往磁盘上写索引文件的频率,达到提高创建索引效率的目的。设计了全文检索实验,实验结果表明,该方法使10 000篇文档创建索引的平均效率比前人方法提高了19.5%,具有良好的应用前景。

  • 单位
    北京信息科技大学; 廊坊燕京职业技术学院; 北华航天工业学院; 北京拓尔思信息技术股份有限公司