文章
· 三月 19, 2023 阅读大约需 4 分钟

第二章 高可用性解决方案 - 虚拟化平台高可用

第二章 高可用性解决方案 - 虚拟化平台高可用

虚拟化平台高可用

虚拟化平台通常提供 HA 功能,通常会监控来宾操作系统及其运行的硬件的状态。在任何一个失败时,虚拟化平台都会根据需要在备用硬件上自动重启失败的虚拟机。当 IRIS 实例重新启动时,它会自动执行正常的启动恢复,保持结构和逻辑的完整性,就好像 IRIS 在物理服务器上重新启动一样。

虚拟环境中的故障转移

虚拟化 HA 具有内置于虚拟化平台基础架构中的优势,因此只需很少的配置工作,在某些情况下根本不需要。此外,虚拟化平台允许有计划地将虚拟机重新定位到备用硬件以进行维护,从而实现物理服务器的升级,例如,无需任何停机时间。

IRIS 镜像

具有自动故障转移功能的 IRIS 镜像采用不同的 HA 方法,依靠完全独立系统之间的逻辑数据复制来避免共享存储的单点故障风险,并确保生产可以立即故障转移到几乎所有的备用 IRIS 实例故障场景——系统、存储和网络。

IRIS 镜像中,一个称为主要故障转移成员的 IRIS 实例提供对生产数据库的访问。单独主机上的另一个实例,称为备份故障转移成员,与主实例同步通信,检索其日志记录,确认收到它们,并将它们应用于同一数据库的自己的副本。通过这种方式,主备都始终知道备份是否有来自主的最新日志文件,因此可以将其数据库与主上的数据库精确同步。

在这种情况下,镜像可以在主要中断的情况下快速自动故障转移到备份,而不会丢失数据。第三个系统,仲裁器,帮助备份确定当主系统变得无响应时它是否应该接管。故障转移成员共享的虚拟 IP 地址或分布式缓存集群等机制将应用程序连接重定向到新的主服务器。故障转移过程只需几秒钟;许多用户甚至不会注意到它的发生。而且因为备份有自己的数据库副本,所以即使主数据库及其存储完全失败也不会导致数据库不可用。事实上,即使备份丢失了最新的日志数据,备份的镜像代理也可以从主主机检索它,如果它仍然在线的话。

一旦将之前的主数据库恢复到故障转移后的运行状态,它就会成为备份数据库,并且其数据库会迅速赶上新主数据库上的数据库,从而使镜像恢复到完整的 HA 功能。然后,可以将系统恢复到原来的角色或保持新的安排。

镜像还可以包括灾难恢复 (DR) 异步成员,它们是主服务器的异步维护副本; DR 异步可以提升为故障转移成员,例如,当发生故障的主数据库无法快速恢复运行时成为备用成员,或者(如果物理上分开)在数据中心故障等中断导致两个故障转移都停止时进行灾难恢复成员。最后,镜像可以包含报告异步成员,它们维护生产数据库的异步副本,用于商业智能和数据仓库目的。

IRIS 镜像

镜像还可以与虚拟化平台 HA 一起使用以创建混合 HA 方法,在这种方法下,虚拟化平台响应计划外系统或操作系统级中断,而镜像处理所有计划内中断和计划外数据库中断(包括 IRIS 中断和存储故障) ) 通过自动故障转移。

HA 解决方案功能比较

下表提供了镜像、集群和虚拟化作为 HA 解决方案的非常一般的特性比较。

特色 IRIS 镜像 操作系统级集群 虚拟化平台高可用
机器断电或崩溃后的故障转移 无缝处理机器故障。 无缝处理机器故障。 无缝处理物理和虚拟机故障。
防止存储故障和数据损坏 内置复制可防止存储故障;逻辑复制避免了大多数类型的损坏。 依赖于共享存储设备,因此故障是灾难性的;存储级冗余是可选的,但可能会带来某些类型的损坏。 依赖于共享存储设备,因此故障是灾难性的;存储级冗余是可选的,但可能会带来某些类型的损坏。
IRIS关闭、挂起或崩溃后的故障切换 内置快速检测和故障转移。 可以配置为在 IRIS 中断后进行故障转移。 可以配置为在 IRIS 中断后进行故障转移。
IRIS 升级 允许最短的停机时间 IRIS 升级。* IRIS 升级需要停机。 IRIS 升级需要停机。
应用程序平均恢复时间 故障切换时间通常为几秒钟。 故障转移时间可以是几分钟。 故障转移时间可以是几分钟。
外部文件同步 仅复制数据库;外部文件需要外部解决方案。 所有文件对两个节点都可用。 故障转移后所有文件可用。

* 需要一种配置,其中应用程序代码、类和例程保存在与包含应用程序数据的数据库分开的数据库中

将分布式缓存与故障转移策略结合使用

无论您采用何种方法实现 HA,都可以使用基于企业缓存协议 (ECP) 的分布式缓存集群在用户和数据库服务器之间提供一层隔离。当数据服务器出现故障时,用户仍然连接到集群的应用服务器;在中断期间主动访问数据的用户会话和自动事务会暂停,直到数据服务器通过完成故障转移或重新启动故障系统再次可用。

但是将分布式缓存添加到 HA 策略会增加复杂性并引入更多的故障点。

讨论 (0)1
登录或注册以继续