基于ESVM的科技政策文本标签分类研究

作者:吴峰; 李银生; 聂永川; 范通让; 赵文彬; 张博
来源:河北省科学院学报, 2018, 35(01): 1-10.
DOI:10.16191/j.cnki.hbkx.2018.01.001

摘要

文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘。本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM科技政策文本标签分类方法。最后,对比SVM和ESVM两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性。

全文