摘要

本发明实施例通过一种面向多请求的科学工作流数据集存储方法,通过工作流的数据集构建工作流表示模型,确定对个存储策略,当多请求访问访问多个数据集时,对多个访问请求进行希尔排序,然后根据排序后的访问请求在工作流表示模型中的数据集的生成顺序,分别计算在每个存储策略下多个访问请求访问的数据集的再生代价以及每个存储策略对应的存储代价,计算每个存储策略的总代价,按照总代价最小的存储策略对应的数据集的存储状态,对数据集进行存储。因此本发明可以在多访问请求访问多个数据集时,降低云环境下科学工作流的花费。