摘要

从主题模型的视角出发,以文本挖掘的手段分析我国十年来有关共享科研数据的文献研究主题演化情况以及热点主题,促进在突发公共事件过程中科研数据共享行为更加合理,让科研数据最大化发挥自身的价值,为今后国内共享科研数据的研究提供借鉴和参考。结合本文的实际研究需求,在中国知网中选取2010到2019年涉及共享科研数据的文献作为研究数据集。使用LDA主题模型对其中的摘要部分进行文本挖掘,在对文本进行预处理的基础上识别出其中所包含的若干主题,分别测定不同主题在不同时间段内的强度,识别出热点主题,并根据强度的变化对主题进行分析。近十年来相关文献共计有32个研究主题,其中14个热点主题,"数据出版""数据共享能力""国内积极促进"3个主题呈现上升趋势,11个主题呈现出下降趋势。对于国内共享科研数据的规范性、国际交流之间的频繁性有所上升,高校图书馆也在其中起到了巨大的推动作用。但是也应该注意在共享科研数据过程中客观存在技术上的障碍、整体社会环境的发生变化要求科研数据共享程度进一步加深、不同数据主体之间共享意愿的巨大差异,如何弥补差异、克服障碍、让科研数据的共享与社会环境的变化结合起来是今后应当重点研究的主题。

全文