摘要
【目的】中文短文本具有特征稀疏的问题,构建高质量的短文本特征表示将对文本的分类、推荐等处理具有重要意义。【方法】针对这一问题,本文提出了一种基于知识图谱和主题模型的短文本特征增强模型,借助知识图谱获取外部知识对短文本进行特征扩展,使用主题模型对短文本进行语义挖掘,最后通过向量拼接生成短文本特征增强向量。【结论】本文将提出的方法应用到中文短文本分类任务中,并进行了对比实验,实验结果证明本文提出的方法能够更好地对短文本进行特征表示。
- 单位
【目的】中文短文本具有特征稀疏的问题,构建高质量的短文本特征表示将对文本的分类、推荐等处理具有重要意义。【方法】针对这一问题,本文提出了一种基于知识图谱和主题模型的短文本特征增强模型,借助知识图谱获取外部知识对短文本进行特征扩展,使用主题模型对短文本进行语义挖掘,最后通过向量拼接生成短文本特征增强向量。【结论】本文将提出的方法应用到中文短文本分类任务中,并进行了对比实验,实验结果证明本文提出的方法能够更好地对短文本进行特征表示。