摘要

<正>随着互联网应用的飞速发展和各行业信息化的普及,数据呈爆发式增长,传统面向对象编程思想和数据处理方式在分析如此海量的数据时出现性能和可扩展性的瓶颈,所以必须研究新的有效的大数据分析平台开发架构,尤其是从底层编程思想着手进行优化,来应对大数据时代所带来的全新挑战。目前业界对于大数据的概念还没有统一定义,IBM公司将其特征概括为大规模、多样性和快速化三方面,其中大规模表示数据量非常大,TB级以上;多样性表示数据不像传统关系数据库那样的结构化数据,而是有较多无法用二维表逻辑来表达的非结构化数据;快速化表