摘要
针对现有很多文本分类算法必须进行训练—测试—再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA)。根据一些选取的文本片段建立学习模型;为了适应轻微变化,采用增量式模型,将选取的文本片段转换到底层架构中,形成模糊语法;利用模糊联合操作将单个文本片段语法进行整合,并将所学习的文本片段转换成更加一般的表示形式。与决策表算法、改进的朴素贝叶斯算法等进行了两组对比实验,第一个实验结果表明,IFGA和其他机器学习算法性能并无明显差异;第二个实验结果说明,增量式学习算法比标准机器学习算法更加具有优势,其性能较平稳,数据的尺寸影响更小。提出的算法具有较低的模型重新训练时间。
-
单位南华大学; 湖南环境生物职业技术学院