摘要

设计了蒙古文硕士论文检索系统,并实现了一个基于云架构的分布式论文检索系统。设计完成了满足分布式要求的蒙古文分析器,作为系统核心模块在分布式多节点上实现了蒙古文的索引和检索功能。在分布式索引方面,主要实现数据哈希分片、蒙古文分析器对每个分片进行分析、评分并建立倒排分片索引。在检索方面,使用BM25概率模型可对蒙古文论文检索和排序,并具有关键词或摘要的中文检索功能。分布式蒙古文硕士论文检索系统,可为进一步研究主题分析提供高质量的蒙古文硕士论文数据。