摘要

互联网新闻中反映的市场观点和情感可为经济监测预警提供及时有效的参考.为更好地识别和量化文本中对于经济变动趋势的观点和情感,本文提出了一种基于趋势情感映射的舆情词典构建方法.该方法识别描述经济趋势的核心词汇形成趋势种子词集,并集成情感词相关性计算结果,利用重新设计的标签传播算法得到映射系数,获得情感词的观点值,形成能够量化新闻的物价舆情词典.本文还提出了一种考虑句法结构的物价舆情指数模型,通过主题匹配、程度量化、否定识别等过程实现对特定领域经济新闻中的观点和情绪的更为精确的度量.实证分析中构建了物价舆情词典并生成物价和食品及其分项物价等11个主题的舆情指数,通过分类检验及与CPI的对比分析,发现基于本文方法所建立的舆情指数在长期趋势上领先于CPI约1.25个月.本文所提出的舆情词典构建方法和舆情指数模型具有可扩展性,有望应用于其他宏观经济或行业市场景气分析研究,是现有基于经济文本的预测预警建模方法的重要改进.