讲解什么是高可用性网络
一、高可用性概念
根据百度词条的解释:高可用性(High Availability),通常用来描述一个系统被设计后,减少了停工时间,保持其服务的高度可用性。
高可用性的度量方式,是根据系统损害、无法使用的时间,以及从无法运作恢复到可运作状况所耗费的时间,与系统总运作时间的比较。如果某个系统能不间断地提供服务,那我们说此系统可用性达100%,如果每100个时间单位中,就有1个时间单位无法提供服务,那我们说此系统可用性是99%。
(注:在线系统和执行关键任务的系统通常要求其可用性要达到5个9标准(99.999%)
高可用性一般是通过提高系统的容错能力来实现的,当然,具体情况具体分析,我们如果要判断某个系统是否具有高可用性,还得从实际情况出发。
二、高可用系统的工作方式
1、主从方式(非对称方式)
主机为主,备用机为辅。当主机在工作时,备用机处于监控状态,一旦主机宕机,备用机立刻接管主机工作,后续主机回复正常后,管理员可自动或者手动切换主机运行。主机和备用机在运行过程中产生的数据皆保留在共享存储系统内。
2、双机双工方式(互备互援)
两台主机同时运行并相互监测,一旦其中一台宕机,另一台立马接管一切工作。关键数据存放在共享存储系统中。
3、集群工作方式(多服务器互备方式)
多台主机并行工作,各自运行一个或几个服务,各为服务定义一个或多个备用主机,当某个主机故障时,运行在其上的服务就可以被其它主机接管。
三、如何保障系统的高可用
根据高可用系统的工作方式,可得知,“单点”是系统高可用的最大风险,应尽量在设计过程中避免。
“冗余”则是保证系统高可用的核心准则。有了“冗余”还不够,如果每次出现故障都需要人工操作恢复,那势必会增加系统的不可服务时间,所以我们通过“自动故障转移”来实现系统的高可用。
接下来我们看下典型互联网架构中,如何通过冗余+自动故障转移来保证系统的高可用特性。
四、高可用性需要的系统组件
环境:鸡蛋不要放在同一个篮子里,同理,服务器如果都在同一地理区域,当自然灾害等因素导致整个系统崩溃时候,情况可能变得很糟糕。
硬件:高可用性服务器应该能够适应电源中断和硬件故障,包括硬盘和网络接口。
软件:整个软件堆栈,包括操作系统和应用程序本身,必须准备好处理可能需要重新启动系统的意外故障。
数据:高可用性系统必须在发生故障时考虑数据安全性。
网络:计划外网络中断是高可用性系统的另一个可能的故障点。为可能的故障制定冗余网络策略很有必要。
高可用性是可靠性工程的重要子集,专注于确保系统或组件在规定的时间段内具有高水平的操作性能。它的实施过程看起来相当复杂,但是,它能为需要提高可靠性的系统带来巨大的好处。
上一篇:高速缓存的基础概念解读
下一篇:AD域与LDAP的关系