摘要
随着健康大数据的飞速发展,对疾控科学计算环境提出新的架构要求和管理要求,数据湖架构能够解决疾控科学计算面临的问题。建设基于数据湖架构的科学计算环境,借助大数据分布式存储和分布式计算相关技术的应用,能够有效融合健康大数据,充分挖掘健康大数据价值;能够整合、优化现有计算资源,节约成本,实现根据任务需求,按需灵活分配计算资源;能够实现科研数据全生命周期管理,提高科学计算的工作效率和透明度,并提高疾控数据管理和分析应用的水平。
- 单位
随着健康大数据的飞速发展,对疾控科学计算环境提出新的架构要求和管理要求,数据湖架构能够解决疾控科学计算面临的问题。建设基于数据湖架构的科学计算环境,借助大数据分布式存储和分布式计算相关技术的应用,能够有效融合健康大数据,充分挖掘健康大数据价值;能够整合、优化现有计算资源,节约成本,实现根据任务需求,按需灵活分配计算资源;能够实现科研数据全生命周期管理,提高科学计算的工作效率和透明度,并提高疾控数据管理和分析应用的水平。