高可用性基础设施和设计的图表

Data used to track, manage, and optimize resources.
Post Reply
Bappy11
Posts: 366
Joined: Sun Dec 22, 2024 6:03 am

高可用性基础设施和设计的图表

Post by Bappy11 »

在线购买云服务时,您可能会看到诸如 99.999% 正常运行时间或 99.9% 正常运行时间之类的数字。就正常运行时间而言,“99 分”似乎足够可靠。毕竟,它非常接近 100%,那么它到底能少多少呢?那些额外的 9 又意味着什么呢?

这比我们想象的要多得多。换个角度来说,99.9% 意味着每年停机时间超过 8 小时,而 99.99999% 则意味着每年停机时间只有 3.15 秒。让我们花一分钟来理解一下。

根据您的业务,您可能需要一个几乎无停机时间的高可用性设置。为了确定这一点,我们整理了一份高可用性基础设施指南,以帮助您了解三个 9、四个 9 和五个 9 之间的具体区别。

让我们开始吧!

了解“9”:三个“9” vs 四个“9” vs 五个“9”
大多数服务提供商(包括电信提供商)都保证一定比例的正常运行时间。这也称为服务水平协议(SLA)。正常运行时间是指机器或系统处于运行状态并积极工作的时间。停机时间是指机器或系统处于非活动状态或无法使用的状态。

停机可能由于以下几种不同的原因而发生:

电力或网络中断
移动设备和设备
设备或仪器发生故障
自然灾害
更新和维护
黑客攻击或网络攻击等等。
如果您没有制定有效的灾难恢复计划,停机可能会导致严重的服务中断。这意味着您的团队无法完成任务或相互沟通。当您的业务无法访问时,您将无法提供可靠的客户服务。

为了解决这个问题并减少潜在的停机时间,建议企业在其系统中建立语音冗余(故障转移和备份)。实现此目的的一种方法是整合高可用性基础设施和服务。

高可用性指南

什么是高可用性基础设施?
高可用性基础设施旨在提供一定水平的运营性能和正常运行时间,这些性能和正常运行时间在规定的时间段内高于正常水平。简而言之,高可用性 (HA) 可创建可靠的系统,让系统持续运行,几乎不会出现停机时间。

这看起来像什么?

高可用性基础设施是通过使用服务器集群(具有故障转移选项)来相互监控而创建的。这样,如果一台服务器发生故障,备份服务器将启动。它会重新启动故障服务器上处于活动状态的应用程序,并使一切恢复正常运行。


高可用性基础设施基础知识
创建高可用性的基础之一是消除单点故障——系统的一个元素如果发生故障,会导致系统中的所有元素发生故障。

为了消除各种单点故障,大多数高可用性架构在基础层面上看起来像这样:

使用负载均衡器在多台服务器之间平衡流量负载。这样,当一台服务器 突尼斯电报数据 离线时,流量将通过另一台服务器发送。
两个负载均衡器提供额外的支持。这样,如果一个负载均衡器发生故障,流量可以故障转移到另一个负载均衡器。
由于故障转移到负载均衡器涉及域名系统 (DNS) 更改,因此您可能会遇到停机。通过添加快速 IP 重新映射工具来解决此问题。弹性 IP 可以轻松平衡负载均衡器之间的流量。
高可用性基础设施基础

了解“9”:三个“9” vs 四个“9” vs 五个“9”的正常运行时间
那么,9 和什么有关呢?9 决定了可用性。换句话说,三个 9 的可用性或五个 9 的可用性是给定时间段(通常是一年)内用户可访问网络或服务的时间百分比。

在此期间,您的服务将经历较高的正常运行时间,而剩下的 0.0001% 是您可能会遇到的停机时间。

下表比较了不同的正常运行时间百分比以及您可能遇到的停机时间:

比较四个 9 与五个 9 可用性的图表。99.999% 的正常运行时间。我们能够保持这种级别的可用性和可靠性,原因如下:

遍布全球的多个地理冗余数据中心
Post Reply