摘要

运营商自身具有大数据的天然优势,为了挖掘海量数据背后隐藏的潜在价值,提出了一种整合分布式消息系统Kafka、分布式流式处理框架Spark、分布式文件系统Hadoop的大数据处理系统,利用K-means聚类算法建立校园学生用户话费消费分类模型。实验结果表明该方法能更加准确地划分用户消费类型,提高运营商的竞争力,证明了本系统的商业价值。

  • 单位
    武汉邮电科学研究院

全文