随着互联网的不断发展,网络信息量迅猛增加,面对海量杂乱无章的信息,用户很难从中快速搜寻到所关注的有用信息。将海量信息进行数据采集、预处理、清洗、分析,最后将分析结果以图表展示,使用户可以获得直观的信息分布十分必要。基于以上需求,本文以新闻数据为研究对象,通过采集器采集数据,数据预处理,并行框架的数据清洗,对数据结果进行分析,并将处理分析的结果以可视化形式来展示新闻信息热点分布状况,使用户高效快捷地了解社会信息焦点状况。