摘要
由于传统的人工分类不够规范、准确,而且随着期刊数字化程度的不断提高,采用文本自动分类技术很大程度上提高了分类的准确率并缓解了人工分类的压力。利用《中国图书馆分类法》建立科技期刊论文类别体系,采用组合多标签特征选择算法(CMLFS)对多标签数据进行特征选择,并采用先进的多标签随机游走算法(MLRW)对科技期刊论文样本集进行训练和测试。结果表明,对中文科技期刊论文进行多标签自动分类,能够简化科技期刊论文多标签分类的过程,提高分类效率,分类效果理想。
-
单位烟台工程职业技术学院