基于SVM的日文网页分类

作者:王清翔; 仲婷; 潘金贵
来源:广西师范大学学报(自然科学版), 2007, (02): 43-46.
DOI:10.16088/j.issn.1001-6600.2007.02.011

摘要

网页分类是使用机器学习算法实现网页类别的自动标注。提出了一种基于SVM的日文网页分类方法,针对日文的特点,设计日文词素词典与规则库,并以此为基础进行日文分词和特征表示,然后使用互信息度进行特征选择,最后应用SVM来构造分类超平面,对日文网页进行分类。最后通过实验进行了验证。

全文