为了改善互联网新闻获取时数据杂、查询慢、阅读效率低等问题,提出了基于大数据的新闻采编和事件分析系统的设计。此系统收集互联网新闻数据,使用数据清洗和分布式存储等技术在数据库中存储;之后分析数据,使用机器学习等技术得到新闻主题;然后聚合新闻,得到事件主题;最后以事件主体展现全部时间,实现新闻收集和事件分析全过程。此系统的使用能够使互联网新闻获取效率得到提高,并且使阅读效率低、数据杂乱等问题得到解决。