维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法

如先姑力·阿布都热西提; 亚森·艾则孜<sup>*</sup>; 郭文强

doi:10.19734/j.issn.1001-3695.2018.07.0410

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法

作者：如先姑力·阿布都热西提; 亚森·艾则孜^*; 郭文强

来源：计算机应用研究, 2019, 36(11): 3410-3414.

DOI：10.19734/j.issn.1001-3695.2018.07.0410

摘要

提出了一种结合n-gram统计模型和类不平衡支持向量机(SVM)分类器的维语文本过滤方法。首先,将网页文本进行预处理操作,通过n-gram统计模型来初步提取词干;然后,对词干进行语义分析,将具有相似含义的词干聚合为一类,以此降低词干维度;最后,在传统SVM中引入一个控制超平面之间距离的参数,构建一种类不平衡SVM,使其能够很好地分类具有非线性不可分和不平衡性的维吾尔语文本。实验结果表明,该方法能够准确分类出不良文本,且具有较短的分类时间。

单位
新疆警察学院; 新疆财经大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-11 18:27

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号