基于信息论的TF-IDF算法在文本分类中的应用研究

胡媛敏; 张寿明<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于信息论的TF-IDF算法在文本分类中的应用研究

作者：胡媛敏; 张寿明^*

来源：中国水运, 2021, 21(12): 31-33.

摘要

为了解决传统TF-IDF算法太过依赖词频,未考虑关键词在不同文本的不同分布对其权重影响的问题,提出一种基于信息论的TF-IDF特征选择和文本分类方法。首先,对文本进行分词以及去停用词的处理,然后使用Word2vec的skip-gram模型结合基于信息论的TF-IDF对处理后的文本进行特征选择,以更准确的表征文本,最后使用双向长短时记忆网络(BiLSTM)来进行访问上下文信息,得到文本分类的结果。结果表明,该方法与原始TF-IDF相比,分类的精确率、召回率和F1值都分别有所提升。

单位
自动化学院; 昆明理工大学

收藏分享被引(14) 浏览

更新时间：2024-04-17 17:34

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号