摘要

分析社交媒体中关联主题在不同社会群体之间的流动模式有助于理解观点、信息和思想的传递.已有的主题流动分析的工作大多是基于主题模型的,只能通过查看包含该主题的文本来分析主题流动的原因.这些文本数据量大且结构复杂,难以分析.为了解决这一问题,使用概念对主题内部的内容进行概括,提出了基于概念的动态文本可视分析方法,用于展示主题内容的变化模式,帮助分析主题流动的原因.该方法使用流型线条展示概念流动模式,并利用基于约束的t-SNE降维算法保证相邻时间段上概念投影分布的相似性,从而保证流型线条的稳定性.为了突出展示主题内概念的异常变化模式,提出了一种异常检测技术用于定位概念剧烈变化的时间段并进行突出显示.使用推特数据集进行定性评估和案例研究,验证了所提出的可视分析方法的准确性和有效性.

  • 单位
    微软(中国)有限公司; 微软(中国)有限公司; 清华大学