摘要
大数据是指大型复杂的结构化或非结构化数据集。大数据技术使组织能够生成、收集、管理、分析和可视化大数据集,并为诊断、预测或其他决策任务提供见解。处理大数据的关键问题之一是采用适当的大数据治理框架,这样可以:(1)以所需的方式管理大数据,以支持有效机器学习的高质量数据访问;(2)确保该框架规范存储和处理在相关监管框架内以可信赖的方式收集来自供应商和用户的数据。提出了一个大数据治理框架,指导组织在相关的规则框架内做出更好的基于数据的业务决策,并密切关注数据安全性、隐私性和可访问性。为了说明这一过程,以网络安全大数据治理为例,给出了该框架的一个实现实例。该框架有可能指导不同组织的大数据管理,实现信息共享和协同决策。