随着大数据技术的发展,高职院校图书馆资源的整合及统一管理已成为发展趋势。Hadoop框架和Apache Spark计算模块的结合可以解决资源共建共享的问题。技术框架中Flume、Kafka、HDFS/Hbase及Apache Spark的联合使用,既能够发挥各模块自身优势,又能够很好配合。经过数据采集、消息订阅、数据分析计算、数据存储在技术上实现一个完整的图书馆资源共建共享系统。