摘要
<正>大数据(big data)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和分析的数据集。大数据具有"4V"特征:①数据容量(Volume)大,常常在PB(1 PB=250 B)级以上;②数据种类(Variety)多,常常具有不同的数据类型(结构化、半结构化和非结构化)和数据来源;③产生和更新速度(Velocity)快(如实时数据流),时效性要求高;④科学价值(Value)大,尽管利用密度低,却常常蕴藏着新知识或具有重要预测价值~([1])。人类已进入大数据
-
单位公共卫生学院; 北京大学; 中国医学科学院