基于改进模糊语法增量式算法的文本分类方法

龚静; 黄欣阳

摘要

针对现有很多文本分类算法必须进行训练—测试—再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA)。根据一些选取的文本片段建立学习模型;为了适应轻微变化,采用增量式模型,将选取的文本片段转换到底层架构中,形成模糊语法;利用模糊联合操作将单个文本片段语法进行整合,并将所学习的文本片段转换成更加一般的表示形式。与决策表算法、改进的朴素贝叶斯算法等进行了两组对比实验,第一个实验结果表明,IFGA和其他机器学习算法性能并无明显差异;第二个实验结果说明,增量式学习算法比标准机器学习算法更加具有优势,其性能较平稳,数据的尺寸影响更小。提出的算法具有较低的模型重新训练时间。

单位
南华大学; 湖南环境生物职业技术学院

收藏分享被引浏览

更新时间：2024-05-12 08:24

基于改进模糊语法增量式算法的文本分类方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友