摘要
<正>随着大数据时代的到来,越来越多的数据需要被进行数字化。档案数据作为最具代表性的文本数据自然成为企事业单位数字化的必选对象。中国联通数字档案馆自2013年上线运行以来,按照信息融合、信息共享的理念,融合了全集团近600多个立档单位的档案资源,实现了9大档案门类的在线归档和实时利用,推进了科技与档案文化事业的融合。但与此同时,仍有两方面问题要解决:一方面,电子档案信息管理中的手工著录标引工作效率极低,而机器自动标引的精确度无法保证,且内容查询检索的关联度不高,无法保证较高的查全率和查准率;另一方面,电子档案数据量巨大,目前使用的档案搜索技术并不能有效