摘要

[目的/意义]从文献深层语义特征角度分析特定领域期刊研究内容中蕴含的新兴主题,对科研工作者了解领域研究热点、寻找进一步研究的方向具有重要意义。[方法/过程]首先,以图书情报领域期刊JASIST为例,从文献句子的语义特征角度出发,使用BERT及其衍生模型进行关键句子的识别;其次,基于MLM提出语言模型的增强方案;最后,使用BERTopic在识别结果的基础上进行面向关键研究语句和摘要的新兴主题发掘及演化分析。[结果/结论]整体句子识别性能F1值超80%,基于MLM的领域模型在关键句子识别上较基准模型性能提升约1~2个百分点,基于BERTopic发现7个新兴热点研究主题。本文提出的关键句子识别和基于BERTopic的主题计算方案能够有效挖掘新兴主题,为科研工作者提供辅助。