第四章高可用性的故障转移策略

IRIS 镜像

具有自动故障转移功能的 IRIS 数据库镜像为计划内和计划外停机提供了一种有效且经济的高可用性解决方案。镜像依赖于数据复制而不是共享存储，避免了由于存储故障导致的重大服务中断。

IRIS 镜像由两个物理上独立的 IRIS 系统组成，称为故障转移成员。每个故障转移成员在镜像中维护每个镜像数据库的副本；应用程序更新在主要故障转移成员上进行，而备份故障转移成员的数据库通过应用来自主要的日志文件与主要保持同步。

镜像自动将主要角色分配给两个故障转移成员之一，而另一个故障转移成员自动成为备份系统。当主要的 IRIS 实例出现故障或不可用时，备份会自动快速接管并成为主要实例。

第三个系统称为仲裁器，它与故障转移成员保持持续联系，为他们提供在无法直接通信时安全地做出故障转移决策所需的上下文。在每个故障转移系统主机上运行的代理进程，称为 ISCAgents，也有助于自动故障转移逻辑。备份无法接管，除非它可以确认主服务器确实已关闭或不可用，并且不会尝试作为主服务器运行。在仲裁器和 ISCAgent 之间，这几乎可以在所有中断情况下完成。

或者，当使用混合虚拟化和镜像 HA 方法（如本节稍后讨论的那样）时，虚拟化平台可以重新启动发生故障的主机系统，从而允许镜像确定以前的主实例的状态并根据需要继续进行。

当镜像配置为使用虚拟 IP 地址 (VIP) 时，将应用程序连接重定向到新的主服务器是透明的。如果连接是通过 ECP 进行的，它们将自动重置为新的主服务器。应用程序连接重定向的其他机制是可用的。

当主实例恢复运行时，它会自动成为备份实例。操作员启动的故障转移也可用于在计划停机期间维护可用性以进行维护或升级。

在虚拟化环境中使用镜像创建了一个结合了两者优点的混合高可用性解决方案。虽然镜像通过自动故障转移对计划内或计划外中断提供即时响应，但虚拟化 HA 软件会在机器或操作系统意外中断后自动重启托管镜像成员的虚拟机。这允许失败的成员快速重新加入镜像以充当备份（或在必要时接管为主）。

将分布式缓存与故障转移策略结合使用

无论采用何种方法实现 HA，都可以使用企业缓存协议 (ECP) 支持的分布式缓存集群在用户和数据库服务器之间提供一层隔离。分布式缓存集群中的应用程序服务器旨在在数据服务器发生故障转移时保留正在运行的应用程序的状态。当数据服务器发生故障时，用户仍保持与应用程序服务器的连接，并且在中断期间主动访问数据库的用户会话会暂停，直到数据服务器通过故障转移的任一完成再次可用。根据应用程序活动的性质和故障转移机制，一些用户可能会在故障转移完成之前遇到暂停，但随后可以继续操作而不会中断他们的工作流程。

分布式缓存集群中的数据服务器可以像独立的 IRIS 实例一样进行镜像以实现高可用性，并且应用服务器可以设置为在发生故障转移时自动将连接重定向到备份。

本章详述的其他故障转移策略也可用于分布式缓存集群。无论数据服务器采用何种故障转移策略，应用服务器都会在故障转移后重新连接并恢复其状态，从而允许应用程序处理从故障前停止的地方继续进行。

但是请记住，分布式缓存的主要目的是水平扩展。将集群简单地部署为 HA 策略的一个组成部分会增加成本，例如增加的复杂性和额外的故障点，以及好处。

第四章 高可用性的故障转移策略

第四章 高可用性的故障转移策略

IRIS 镜像

将分布式缓存与故障转移策略结合使用

第四章高可用性的故障转移策略

第四章高可用性的故障转移策略