基于word2vec模型的短文本数据流的快速增量式分类方法

李培培; 胡阳; 胡学钢

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于word2vec模型的短文本数据流的快速增量式分类方法

作者：李培培; 胡阳; 胡学钢

来源：2019-03-06, 中国, ZL201910169255.3.

摘要

本发明公开了一种基于word2vec模型的分布式短文本数据流快速增量分类方法,其步骤包括：1从知识库中获取外部语料库构建woord2vec模型,并获取词向量集合Vec；2构建动态线性LR分类器组与全局类标签集合；3增量式更新全局标签集合,修改并增加分类器组；4预测样本,获取未在词集合Vocab中的新词样本集合,构建词向量模型与词向量扩展集合；5获取测试数据流的类标签强度。本发明能够提高短文本数据流的分类准确率,减少模型构建的时间消耗,从而达到快速适应短文本数据流分类的目的。

单位
合肥工业大学

收藏分享被引浏览

更新时间：2024-12-27 21:00

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号