摘要
[目的/意义]针对研究人员所面临的学术信息过载的困境,尝试从海量科技会议的议题报告中发现新兴主题,及时跟踪各领域研究动向,为科研人员的科学研究提供辅助决策。[方法/过程]首先采集某领域国际会议的议题报告,然后通过无参数概率主题模型(HDP)对文档进行无监督主题抽取,进而结合新颖度(NI)、会议出现率(COR)以及主题强度比(TIR)等指标,对主题所处的生命周期(生成、新兴、成熟、衰老)阶段进行判定。[结果/结论]利用上述方法对2008—2017年人工智能领域660份议题报告的分析,共抽取39个主题,对主题所处阶段进行判定,从而发现目标新兴主题。结果表明:该方法能准确高效地识别新兴主题,同时能为新兴主题趋势预测提供可视化。
- 单位