摘要
<正>随着分布式应用、云计算等技术在金融领域的逐步深入发展,Java类应用在企业中的应用规模、架构复杂性、故障定位难度也日益增加。作为系统的运维人员,系统的稳定性、安全性及如何保证对业务部门承诺的系统SLA是我们关注的重点。为了保证系统的SLA,如何做到防患于未然,在开发、测试阶段提前发现潜在问题及问题出现时在第一时间对问题定位、及时恢复系统是我们首先要考虑的问题。在常规的系统运维中,从最早的被动运维阶段,收到告警、投诉后的人工被动处理,慢慢演变成逐步完善的脚本、工具化运维,即收到告警、投诉后,根据场景