泛娱乐情报主题的感知研究

作者:于汝意; 刘秀磊*; 刘旭红; 张良; 王延飞
来源:北京信息科技大学学报(自然科学版), 2020, 35(02): 58-61.
DOI:10.16508/j.cnki.11-5866/n.2020.02.011

摘要

针对泛娱乐情报存在繁杂、异构、信息量较少的特点以及传统主题发现方法感知结果准确率低等问题,提出了一种基于潜在语义索引结合常识知识库的泛娱乐情报主题感知方法。根据泛娱乐情报的语料特征,首先在预处理阶段采用HowNet知识库进行语义去重、同义词合并,形成文本向量作为潜在语义索引模型的输入;然后通过潜在语义索引模型,对泛娱乐情报进行主题感知。该方法是主题模型在泛娱乐领域情报分析中的一次尝试,具有一定的实践意义。