基于特征权重的词向量文本表示模型

作者:蒋延杰; 李云红*; 苏雪平; 张蕾涛; 贾凯莉; 陈锦妮
来源:西安工程大学学报, 2022, 36(01): 108-114.
DOI:10.13338/j.issn.1674-649x.2022.01.015

摘要

针对传统文本表示方法无法准确表达文本信息、稀疏维度高等问题,提出基于特征权重的词向量文本表示模型。通过Glove模型获得词向量,然后分别与TF-IDF、N-Gram模型相结合,分析考虑了文本的全局信息,解决了传统表示方法中稀疏维度高的问题,更好地捕捉了文本的语义和语序等局部信息,提高了文本特征表达能力。最后,通过20NewsGroup和5AbstractsGroup测试,分类准确率分别为85.93%、87.02%,验证了文本表示模型的有效性。

全文