基于知网理论开展对数字化档案信息的语义相似性进行研究。通过对数字化档案信息的语义知识的义原分析,建立一个语义词典"知网",在此基础上提出一个新的特征集合相似度计算方法来对档案信息类别间的相似度进行量化。