摘要

传统数据分析技术无法对动态数据进行分类,造成了分类过程加速较慢的问题.为此,设计基于Python语言的文本数据流自适应分类方法.将网络数据采集过程构建为模型的形式,获取文本数据流信息.将Python语言与网络爬虫技术应用到数据预处理与挖掘过程中,为后续处理提供精准度较高的数据基础.使用半监督学习半聚类分析方法构建分类器,完成文本数据流自适应分类过程.实验结果表明本文方法在提高分类加速度的同时,优化了数据分类结果,具有一定的使用价值.

  • 单位
    安徽黄梅戏艺术职业学院; 池州职业技术学院