摘要
近年来,网络问政平台上各类反映社情民意的文本数据量不断攀升,而人工审阅速度慢,效率低,从而使政府传统的舆情监测体系受到了极大的挑战.使用基于TF-IDF (Term Frequency-Inverse Document Frequency)的朴素贝叶斯模型和LSI (Latent Semantic Indexing)模型对数据库中的海量留言进行分类,并采用基于牛顿冷却定律的热度评价体系计算每类留言的热度值,给出关于评价答复意见质量的指标和有关方案.算法利用Python语言设计程序,可实时加入新的舆情数据进行监测和分析,数值结果验证了本方法可以准确实时地进行问政平台中文本数据的挖掘和处理,为有关部门对群众留言信息高效处理提供了重要的数据参考.
- 单位