摘要

面对科学工作流中的大型数据集,如何在保证数据安全的前提下最小化传输时延是一个重要的挑战。将云计算和边缘计算的优势相结合,构建了云边环境下基于副本的数据布局模型,并提出了一种基于遗传算法算子的非线性惯性权重离散粒子群优化算法(NPSO-GA)。该方法考虑了考虑数据安全、数据中心的传输带宽、存储容量等因素,动态生成数据副本以降低科学工作流传输时延;通过在粒子群算法中引入遗传算法的交叉和变异算子,增强了粒子群算法的搜索能力,避免早熟收敛。实验结果表明,基于NPSO-GA的数据副本布局策略可以有效降低科学工作流执行过程中的传输时延。