摘要

介绍基于电力公司的多格式文档智能信息搜索系统的设计原理和实现过程。通过PHP调用COM组件以及Java调用jar包,将其他多种文档转换为".txt"文档,经过分词并采用基于句子特征的文本摘要生成方法生成".txt"文档的摘要。检索模块采用基于词索引的全文检索,信息检索模型采用空间向量模型,实现摘要及高相关度句子的输出。

全文