基于双词语义扩展的Biterm主题模型

作者:李思宇; 谢珺; 邹雪君; 续欣莹; 冀小平
来源:计算机工程, 2019, 45(01): 210-216.
DOI:10.19678/j.issn.1000-3428.0049745

摘要

针对Biterm主题模型短文本文档的双词产生过程中词对之间缺乏语义联系的情况,提出一种融入词对语义扩展的Biterm主题模型。考虑双词的语义关系,引入词向量模型。通过训练词向量模型,判断词与词之间的语义距离,并根据语义距离对Biterm主题模型进行双词语义扩展。实验结果表明,与现有Biterm主题模型相比,该模型不仅具有较好的短文本主题分类效果,而且双词间的语义关联性能及主题词义聚类性能也得到明显提升。