摘要

为了进一步提高期刊论文题名信息分类查准率和查全率,提出一种基于改进KPCA与SVM的知网题名信息分类算法。基于中国知网数据库选取《中文核心期刊要目总览》(2014年版)2017年度31种计算机学科(TP)期刊收录的13 401篇论文题名作为实验语料库,采用改进KPCA算法对数据进行降维和特征提取,将提取的特征数据库作为SVM的输入进行训练和分类。实验结果表明,该方法较以往分类算法能够进一步提高期刊论文题名的分类效果。

全文