基于LightGBM模型的文本分类研究

作者:邢红梅; 陈欣; 王慧
来源:内蒙古工业大学学报(自然科学版), 2020, 39(01): 52-59.
DOI:10.13785/j.cnki.nmggydxxbzrkxb.2020.01.008

摘要

随着互联网用户的增加,由其产生的文本数据也在爆炸式增长,如何有效地对这些海量数据进行分类管理并提高分类精度,成为自然语言处理中的热门研究课题.使用LightGBM算法作为文本分类模型,对最大深度和叶子节点数量等参数进行调优,从而提高算法的性能.针对NLPCC 2014数据集进行实验,对比NLPCC 2014会议结果报告,本文使用调优后的LightGBM算法在精确率、召回率和F1值都有较好的结果.