基于Storm云平台的增量文本分类机制研究

作者:韩耀廷; 许志伟*; 刘利民
来源:内蒙古工业大学学报(自然科学版), 2018, 37(04): 279-286.
DOI:10.13785/j.cnki.nmggydxxbzrkxb.2018.04.006

摘要

文本分类是目前众多大数据应用的核心问题.本文将Batch SVM增量算法与Bagging算法相结合,提出了一种增量文本分类算法.在云计算分布式处理框架Storm基础上整合所提出的算法,构建了一套高效的基于Storm云平台的在线增量文本分类机制,在真实数据集上构建的实验验证了所提机制的准确性和效率,在保证准确度达到90%的前提下,所提机制的处理时延较现有算法降低50%以上,可以有效实现在线文本分类问题.

全文