摘要

信息技术应用平台的拓展、互联网用户数量的大幅度增加,使得网络平台成为人们生活、工作的重要阵地,随之而来的,网络数据计算、分类需要以秒级为单位处理,技术难度更大。为深入、全面的开发数据资源的内在价值,进一步提升文本分类的实践技术应用成为当务之急。作为信息检索与数据分类、文本挖掘、信息利用的重要技术手段,文本分类的技术研究已经迈入新的阶段,以非线性、核方法、数据集偏斜与多层分类、web网页分类为代表的技术创新应用,已经成为现阶段文本分类的重要技术研究方向。