摘要

近几年来,关于档案数据挖掘与分析的研究成果日益增多,具有重要的理论研究意义和现实应用价值。对于综合性档案馆来说,庞大的档案数据随着数字化工程的日趋丰满,亟待打破常规模式与传统做法,有所突破。目前大多数综合性档案馆都处于档案数字化建设进程中,案卷级目录、文件级目录数据库建设已基本成型,档案全文数字化工作正如火如荼。在档案数据动态变化状态下充分利用现有资源进行数据分析和挖掘,是论证并开展基于特征提取与数据分析的档案语义关联模型应用研究与实践的根本目的。