摘要

信息技术的迅猛发展使得单机服务器已很难满足企业和科研中多租户、多任务的计算需求,如何有效地组织和协调多机进行服务同时屏蔽底层实现细节、减少用户的学习和使用成本则是当前分布式系统研究的难点和重点。为了实现多机之间的分布式作业调度,减少运维和学习成本,本文设计与实现一种轻量级的分布式作业管理系统,理论与实践结果表明该系统能够有效地完成多机之间任务的调度和执行,具备良好的容错能力和可扩展性。