随着互联网用户的增加,由其产生的文本数据也在爆炸式增长,如何有效地对这些海量数据进行分类管理并提高分类精度,成为自然语言处理中的热门研究课题.使用LightGBM算法作为文本分类模型,对最大深度和叶子节点数量等参数进行调优,从而提高算法的性能.针对NLPCC 2014数据集进行实验,对比NLPCC 2014会议结果报告,本文使用调优后的LightGBM算法在精确率、召回率和F1值都有较好的结果.