摘要
<正>大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据的“大”是一个相对概念,没有具体标准,如果一定要定一个标准,那么10TB~100TB通常称为大数据的门槛。实际应用中,很多企业级用户把多个数据集放在一起,已经形成了PB级的数据量。而且随着数据来源的多样化,数据的类型也更加复杂,如网络日志、音频、视频、图片和地理位置信息等。