我们数据中心的冗余和灾难恢复数据中心宕机会给数据中心提供商及其客户造成严重损失,因此数据中心运营商和架构师会竭尽全力提高系统的弹性。 这些措施包括独立磁盘冗余阵列 (RAID)(用于在存储介质发生故障时防止数据丢失或损坏),以及备用数据中心冷却基础设施(即使主冷却系统发生故障,也能使服务器在最佳温度下运行)。
许多大型数据中心提供商将多个数据中心分布在不同的地区,因此,当一个地区发生自然灾害或因政治原因导致运营中断时,可使用四层系统,对数据中心的冗余和弹性进行评级:
第一层 — 提供基本冗余容量组件,如不间断电源 (UPS) 和 24/7 式持续冷却,以支持办公室环境或更高级别的 IT 运营。
第二层 — 增加了额外的冗余电源和冷却子系统,如发电机和储能设备,以提高安全性,防止中断。
第三层 — 添加了冗余组件,这是区别于其他数据中心的关键。 当设备需要维护或更换时,第三层设施不需要关闭。
第四层 — 通过实施多个物理隔离的独立冗余容量组件,提高容错能力,因此当一台设备发生故障时,不会对 IT 运营造成任何影响。