摘要
本发明公开了一种基于专家论文大数据的研究热点分析方法,包括以下步骤:S1、根据关键词,以知识数据库为数据源进行论文搜索,并抓取论文标题、发表时间、作者、数据来源这些开放性数据;S2、根据下载的论文标题,进行分词处理,删除连词、介词、代词这些结构性词汇,去除动词、形容词词性的词汇,只保留名词,得出热点词汇列表;S3、通过专业论文日常用词语料库匹配排除法,将热点词汇列表中的日常用词删除,得出专业词汇列表;S4、对专业词汇列表进行词频分析,并以词频降序排列,选取前百位数据得到专业词汇词频总表;S5、增加年份数据,在专业词汇词频总表的基础上,根据不同年份列出词频分表,得出以时间为轴线的关注点变化趋势。
- 单位