摘要

提出一种改进的PSO-SVM算法。首先在文本预处理时,针对互信息方法存在的低频特征词倚重,忽略了高频特征词的不足之处,引入了权重因子、类内和类间离散因子进行属性约简;然后基于支持向量机分类模型,以不同核函数相结合构造混合核函数,利用粒子群优化算法(PSO优化算法)迭代寻找全局最优参数组合,并以此参数构造混合核函数结合哈夫曼最优二叉树生成分类器。使用经典数据集对PSO-SVM算法进行性能分析,实验表明改进后的算法可以有效地减少冗余属性,降低计算复杂度并具有更高的准确率和召回率。