摘要
为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究。然而,目前丝路文化遗产数据呈现多源异构的特性,包括不同来源的数据和不同模态的数据,导致了对多维度海量数据进行深层次的处理较为困难。文章首先通过对互联网数据的垂直搜索,高效采集丝绸之路相关信息;接着利用支持向量机自动快速、精确地完成文本分类工作;然后利用文本聚类技术对数据信息进行去重、去噪等清洗作业;最后,评选出影响力较大的事件,形成《丝绸之路文化遗产年报》对全球公开发布。文章为丝路文化遗产数据的分析与挖掘提供了经验与借鉴。
-
单位浙江理工大学; 中国丝绸博物馆; 温州职业技术学院; 同方知网(北京)技术有限公司; 同方知网(北京)技术有限公司