摘要
文章在python语言环境中对数据进行处理,通过4种机器学习模型(逻辑回归、多项式朴素贝叶斯、线性支持向量机和随机森立)对武汉市网络问政相关的群众留言进行分类。经对比,选择出效果最好的线性支持向量机模型,该模型的F-Score值达到了0.70,整体效果较好。文章根据预处理后的数据,绘制高频词云图,建立LDA模型并确定最优主题数为12,同时根据主题对群众留言进行分类,建立热度评价指标,给出热度评价结果并对其进行分析。
-
单位湖北文理学院