在没有仲裁的情况下恢复故障转移群集

在没有仲裁的情况下恢复故障转移群集是一项关键技能,因为它使你能够快速还原服务,并在仲裁丢失时最大程度地减少停机时间。 仲裁对于故障转移群集正常运行至关重要,因为它可以防止脑裂的情况,并确保一致的数据完整性。 如果没有 Quorum,群集将无法做出权威决策,从而会导致服务中断。 通过遵循这些准则,管理员可以增强其系统的弹性,并保持持续、可靠的运行,即使面临意外挑战也是如此。

没有足够仲裁票数的群集无法启动。 作为第一步,你应该始终确认群集仲裁配置,并且调查为什么该群集不再具有仲裁。 如果有已停止响应的节点,或者如果在多站点群集中无法访问主站点,则可能发生此情况。 确定了群集失败的根本原因后,你可以使用本部分中所述的恢复步骤。

Note

  • 如果因为丢失仲裁而停止群集服务,则事件 ID 1177 将出现在系统日志中。
  • 始终有必要调查丢失群集仲裁的原因。
  • 最好始终使节点或仲裁见证进入正常运行状态(加入群集),而不是在没有仲裁的情况下启动该群集。

Prerequisites

  • 你的设备必须在所有群集节点上运行 Windows Server 2012 或更高版本。

  • 故障转移群集功能必须安装在每个节点上。 若要了解详细信息,请参阅 安装或卸载角色、角色服务或功能

    或者,可以运行以下命令来安装故障转移群集:

    Install-WindowsFeature -Name Failover-Clustering -IncludeManagementTools
    
  • 你必须是管理员组或域管理员组的成员。

  • 群集中所有节点都可以访问的共享存储,例如网络附加存储 (NAS) 或存储区域网络 (SAN)。

强制启动群集节点

在你确定不能通过使节点或仲裁见证进入正常运行状态恢复群集之后,有必要强制启动该群集。 强制群集开始替代群集仲裁配置设置,并在 ForceQuorum 模式下启动群集。

若要强制群集节点在没有仲裁的情况下启动,请在以管理员身份在提升的 PowerShell 窗口中运行以下命令:

Start-ClusterNode -ForceQuorum

当群集不具有仲裁时,在多站点群集中强制启动该群集可能特别有用。 假设有一个灾难恢复方案,其中包含分别位于主站点和备份站点(如 SiteASiteB)的群集。 如果 SiteA 发生真正的灾难,可能需要大量时间让网站重新联机。 你可能希望强制 SiteB 联机,即使它没有仲裁。

ForceQuorum 模式下启动群集后,在重新获得足够的仲裁投票后,群集会自动离开强制状态,并且其行为正常。 因此,通常没必要再次启动群集。 如果群集失去一个节点并且失去仲裁,则因为它不再处于强制状态,所以它将再次脱机。 若要还原丢失仲裁的群集,必须强制其在没有仲裁的情况下启动。

Note

  • 强制启动群集后,管理员将完全控制其操作。
  • 当群集在特定节点上强制启动时,它会使用该节点的配置并将其复制到所有其他可访问的节点。
  • 如果强制群集在没有仲裁的情况下启动,则当群集保持 ForceQuorum 模式时,将忽略所有仲裁配置设置。 节点投票分配和动态仲裁管理设置是有效配置故障转移群集的基本注意事项。

阻止群集节点上的仲裁

在节点上强制启动该群集后,必须使用要阻止仲裁的某个设置启动群集中的所有剩余节点。 使用阻止仲裁的设置启动的节点指示群集服务加入现有运行群集(而非形成新的群集实例)。 这阻止剩余节点形成包含两个竞争实例的拆分群集。

在强制在备份站点 SiteB 上启动群集后,需要在多站点灾难恢复方案中恢复群集时,这是必需的。 若要在 SiteB 中加入强制启动群集,主站点 SiteA 中的节点需要阻止仲裁启动。

可以在提升的窗口中使用故障转移群集管理器或 PowerShell 执行群集恢复。

Important

在节点上强制启动群集后,我们建议你始终使用阻止的仲裁启动剩余节点。

  1. 服务器管理器中,选择工具,然后选择 故障转移群集管理器

    或者,选择“ 开始”,键入 故障转移群集管理器 并选择它。

  2. 在左侧窗格中,选择要恢复的群集。

    若要指定群集,请在 “作”下的右窗格中,选择“ 连接到群集”。 键入群集名称,然后选择“ 确定”。

  3. “作”下的右窗格中,选择“ 强制群集启动”,然后选择“ ”。

如果选择启动群集服务而不是强制群集启动,则节点会自动启动,并使用阻止仲裁的设置。

灾难恢复配置的仲裁注意事项

本部分概括了灾难恢复部署中两个多站点群集配置的特征和仲裁配置。 仲裁配置指南有所不同,具体取决于针对站点之间的工作负载,是需要自动故障转移还是手动故障转移。 你的配置通常与组织中确定的服务水平协议 (SLA) 保持一致。 这些 SLA 定义在站点故障或灾难期间提供和支持群集工作负载的期望。

在此配置中,群集包含可以托管群集角色的两个或多个站点。 如果在任何站点上发生故障,则群集角色预期会自动故障转移到剩余站点。 因此,必须配置群集仲裁,以便任何站点都可以维持完整的站点故障。

下表总结了有关此配置的注意事项和建议。

Item Description
动态仲裁管理 应该启用
每个站点的节点投票数 应该相等
节点投票分配 因为所有节点都同等重要,所以不应删除节点投票
见证配置 建议使用文件共享见证,该见证配置在从群集站点分开的站点中
Workloads 可以在任何站点上配置工作负载

有必要在单独的站点中配置文件共享见证,以给每个站点均等的生存机会。

另请参阅