摘要
本发明公开了一种多维度网络舆情大数据对比分析方法,所述方法在双关键词搜索的基础上,对下载的网站进行自定义,分为三类不同数据来源进行全文搜索和数据采集,并对相关文章标题进行语义分析,经过分词、词频排序、新闻文本日常用词语料库匹配排除,得出有效的新闻热点专业词汇列表,并对不同数据来源的新闻热点专业词汇列表进行对比分析。采用互联网新闻文本大数据分析得出的词频数据,其样本量巨大,具有较高真实性和客观性,代表政府部门、公众群体观点,能够弥补传统的访谈和问卷调查方法数据样本量较小和取样随机性不足的缺陷,可以为进一步的公众观点主观评价分析提供数据参考。
- 单位