面向动态数据流的三支多粒度主题建模方法

作者:李昱洁; 杨新*; 李妙妙; 李天瑞
来源:山西大学学报(自然科学版), 2022, 45(01): 31-40.
DOI:10.13451/j.sxu.ns.2021060

摘要

传统机器学习模型大多依赖封闭世界假设,难以持续挖掘开放环境下动态文本数据流的语义信息。文章考虑动态数据流的粒特征变化,提出了一种基于三支多粒度学习思想的主题建模方法(Three-way Multi-granularity Topic Model,3WMTM)。根据“文本-主题-词汇”的粒度参数演化机理,构建了主题模型的动态多粒度分析框架,在主题不断新增背景下自适应更新阈值。实验结果表明,3WMTM算法在动态环境下能够维持较好的决策精度,即统计上无显著差异;并且3WMTM算法能够在每个决策阶段立即给出判断,因此在决策成本上优于现有模型。

全文