企业非结构化数据检索研究

作者:徐树振; 罗学礼; 王森; 杨莉; 段嘉杰; 张德刚
来源:信息技术, 2014, (04): 196-200.
DOI:10.13274/j.cnki.hdzj.2014.04.045

摘要

随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。

  • 单位
    云南电力试验研究院(集团)有限公司电力研究院; 昆明理工大学; 云南电网公司; 云南电力试验研究院(集团)有限公司电力研究院

全文