新闻动态大文件传输

讲解什么是高可用性网络

2019-08-01高可用

一、高可用性概念

根据百度词条的解释：高可用性（High Availability），通常用来描述一个系统被设计后，减少了停工时间，保持其服务的高度可用性。

高可用性的度量方式，是根据系统损害、无法使用的时间，以及从无法运作恢复到可运作状况所耗费的时间，与系统总运作时间的比较。如果某个系统能不间断地提供服务，那我们说此系统可用性达100%，如果每100个时间单位中，就有1个时间单位无法提供服务，那我们说此系统可用性是99%。

高可用-1-1

（注：在线系统和执行关键任务的系统通常要求其可用性要达到5个9标准(99.999%)

高可用性一般是通过提高系统的容错能力来实现的，当然，具体情况具体分析，我们如果要判断某个系统是否具有高可用性，还得从实际情况出发。

二、高可用系统的工作方式

1、主从方式（非对称方式）

主机为主，备用机为辅。当主机在工作时，备用机处于监控状态，一旦主机宕机，备用机立刻接管主机工作，后续主机回复正常后，管理员可自动或者手动切换主机运行。主机和备用机在运行过程中产生的数据皆保留在共享存储系统内。

2、双机双工方式（互备互援）

两台主机同时运行并相互监测，一旦其中一台宕机，另一台立马接管一切工作。关键数据存放在共享存储系统中。

3、集群工作方式（多服务器互备方式）

多台主机并行工作，各自运行一个或几个服务，各为服务定义一个或多个备用主机，当某个主机故障时，运行在其上的服务就可以被其它主机接管。

三、如何保障系统的高可用

根据高可用系统的工作方式，可得知，“单点”是系统高可用的最大风险，应尽量在设计过程中避免。

“冗余”则是保证系统高可用的核心准则。有了“冗余”还不够，如果每次出现故障都需要人工操作恢复，那势必会增加系统的不可服务时间，所以我们通过“自动故障转移”来实现系统的高可用。

接下来我们看下典型互联网架构中，如何通过冗余+自动故障转移来保证系统的高可用特性。

四、高可用性需要的系统组件

环境：鸡蛋不要放在同一个篮子里，同理，服务器如果都在同一地理区域，当自然灾害等因素导致整个系统崩溃时候，情况可能变得很糟糕。

硬件：高可用性服务器应该能够适应电源中断和硬件故障，包括硬盘和网络接口。

软件：整个软件堆栈，包括操作系统和应用程序本身，必须准备好处理可能需要重新启动系统的意外故障。

数据：高可用性系统必须在发生故障时考虑数据安全性。

网络：计划外网络中断是高可用性系统的另一个可能的故障点。为可能的故障制定冗余网络策略很有必要。

高可用性是可靠性工程的重要子集，专注于确保系统或组件在规定的时间段内具有高水平的操作性能。它的实施过程看起来相当复杂，但是，它能为需要提高可靠性的系统带来巨大的好处。