基于堆叠降噪自编码机的广告博文识别方法

赵晓乐; 栾杰; 冯旭鹏; 刘利军; 黄青松

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于堆叠降噪自编码机的广告博文识别方法

作者：赵晓乐; 栾杰; 冯旭鹏; 刘利军; 黄青松

来源：小型微型计算机系统, 2018, 39(09): 1921-1926.

摘要

在针对广告博文进行识别过程中,首先构建文本特征向量和人工定义的特征向量,使用堆叠降噪自编码机对这两种特征向量进行处理,获得处理后的两种特征向量,然后将得到的这两种特征向量进行组合得到第三种特征向量.最后将这三种特征向量用于最大熵分类模型的训练,依据实验结果找出分类效果最好的模型,使用该模型对博文进行处理过滤掉其中的广告博文,实验证明得到的最大熵分类模型的P、R、F可达到65.58%、87.9%、75.12%,能有效识别绝大多数的广告博文.

单位
自动化学院; 昆明理工大学

收藏分享被引浏览

更新时间：2024-04-25 07:14

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号