摘要

[目的 /意义]大科学时代,海量且类型多样的学术文献给新兴主题的识别和把握带来一定的困难和障碍。因此,基于多源数据,新兴主题探测方法的研究就十分必要和有意义。[方法 /过程]对期刊论文、学位论文、会议文献、基金项目等多种来源数据,利用PLDA模型分别进行文本语义内容挖掘,结合VSM模型将多源数据在主题语义层面进行深度融合,并根据新兴主题特征量化指标进行筛选和识别。[结果 /结论 ]实证研究表明将文本内容挖掘和文献计量测度相结合进行文化遗产领域新兴主题探测方法可行;同时分析该领域新兴主题的数据源分布情况,发现其最初多以会议文献和基金项目形式呈现,期刊论文、学位论文具有一定滞后性。

全文