摘要
高性能计算问题通常具有子任务并行化的特点,同时在执行过程中需要消耗大量计算资源。以虚拟机作为分布式节点的传统云计算已经被证明能够很好地处理一些常见的高性能计算问题,但分布式环境的管理和解决方案的分布式设计令处理过程变得较为复杂。函数计算是一种新的无服务器云计算范型,其自动扩容的特性和可观的计算资源恰好与高性能计算问题能够很好地结合,但函数计算自动扩容的特性带来的冷启动延迟却是函数计算平台上一个无法避免的问题,尤其是在执行高性能计算这一类存在高并发量作业的任务时,这种延迟会被进一步放大。首先分析一个高性能计算任务在冷启动和热启动情况下的完成时间,同时分析造成额外延迟的原因,然后结合时间序列分析工具和平台自身的扩容机制,提出一种预热方法,这种方法能够有效地降低高性能计算任务在函数计算平台上产生的冷启动延迟。
- 单位