摘要
[目的/意义]挖掘海量文章中的研究主题,梳理研究主题的演化脉络和关联,预测主题前沿热点,增强演化结果的科学性和生动性。[方法/过程]文章提出时序影响因子的概念作为关键词提取中的重要特征,采用时间窗口的方法,利用主题模型挖掘与主题识别,并进行可视化分析,通过对深度学习领域的时间序列模型的应用,达到预测主题流行度的目的。[结果/结论]实验验证了融合时序特征的关键词提取,可以提升主题模型的效果,通过可视化方式既能观察到整体的主题流行度变化趋势,也能对各个时间段的主题内容进行演化分析,观察其分裂和合并的趋势。
- 单位