如今,现代公司面临着越来越多与韧性相关的挑战,这在客户日益期望服务“永远在线、永远可 用”的背景下尤其如此。公司需要构建远程团队和复杂的分布式应用,同时也需满足客户对新应 用程序不断增长的需求。因此,公司及其应用均需比以往更具韧性。 根据亚马逊云科技的定义,韧性是指应用程序抵抗中断(包括与基础设施、依赖服务、错误配置 和瞬态网络问题等相关的中断)或从中断中恢复的能力(参见《Amazon Well-Architected Framework 可靠性支柱文件》中的“韧性和可靠性组件”部分)。然而,为了达到期望的韧性水 平,公司通常需要进行权衡,需要对操作复杂性、工程复杂性和成本进行评估和相应调整。 在与客户和内部团队展开多年合作的基础上,亚马逊云科技开发了一个韧性系统生命周期建设 框架,其中包括了韧性知识和最佳实践。该框架概述了下图所示的五个关键阶段。在每个阶段, 您都可以运用相应的策略、服务和机制来优化韧性状态。