摘要
科技资源已成为推动科技进步的关键因素。科技资源的孤岛问题严重阻碍了科技资源的流通及共享,多源数据聚合成为有效解决该问题的关键。针对论文和专利两种不同来源的异构数据展开聚合研究。首先,利用模式匹配方法计算出目标表的结构;其次,利用关系代数的方式对数据调解与整合过程进行建模;最后,利用模型对异构数据进行聚合,得到了聚合的XML数据。在模式匹配中,匹配属性的余弦相似度最高达到0.748,并且聚合结果具有较强的可解释性,验证了该模型的可行性与正确性。
-
单位经济管理学院; 北京航空航天大学