基于ELK与Spark的可扩展征信日志挖掘系统研究

作者:陆奎; 李存正; 沈强
来源:金陵科技学院学报, 2020, 36(03): 1-6.
DOI:10.16515/j.cnki.32-1722/n.2020.03.001

摘要

ELK架构是目前主流的日志大数据分析解决方案之一,ELK拥有比Spark更高的实时性,集成和部署比Spark简单方便,而且几乎可以在任何系统中进行集成。但是它的其通用性导致了它只能适用于一些简单的场景,无法像Spark一样精确针对每个应用系统进行复杂业务分析扩展。为了降低日志收集和清洗的开发成本同时兼顾分析的高实时性和可扩展性,结合ELK Stack与Spark,同时引入Kafka消息队列,构建了一套可扩展、高实时性且具有良好稳定性的征信日志挖掘系统。该系统比全栈Hadoop技术的大数据系统的开发工作量减少60%以上,且具有可根据企业需求灵活进行自定义分析组件的优点。

  • 单位
    安徽理工大学; 金陵科技学院

全文