本文探讨有助于复原 Azure 本地部署的关键基础结构元素,以及它们如何在硬件故障、网络中断和站点级灾难面前支持连续性。
基础结构复原是 Azure 本地部署的可靠灾难恢复策略的基础。 在虚拟机(VM)和应用程序可以受到保护之前,必须设计基础物理和逻辑基础结构才能承受故障和中断。 这包括选择经过验证的硬件、实现高性能存储、设计冗余网络拓扑以及配置弹性作系统组件。 在 Azure 本地基础结构与 Azure 云服务连接本地基础结构的混合环境中,确保基础结构堆栈的每一层具有复原能力,对于维护运行时间、保护数据以及实现无缝恢复至关重要。
硬件
任何 Azure 本地实例部署的复原能力都从其物理硬件开始。 必须在经过测试和认证的硬件上运行 Azure Local,以确保关键工作负荷的可靠性、兼容性、最佳性能和可支持性。 因此,Azure Local 只能安装在特定 OEM 硬件合作伙伴提供的已验证硬件上。
可以从不同的硬件类别中进行选择,包括已验证的节点、集成系统或顶级解决方案。 适用于 Azure 本地的顶尖解决方案是通过与我们的硬件合作伙伴广泛协作开发的交钥匙解决方案,确保了最高水平的集成和验证。 有关所有可用平台和解决方案类别,请参阅 Azure 本地目录。
故障转移群集
Windows Server 故障转移群集是 Azure 本地高可用性技术的核心组件,为 VM 的复原和故障转移提供框架。 Azure 本地实例可以包含故障转移群集中配置的多个物理节点。 如果一个或多个服务器节点发生故障,其角色(VM、存储、网络等)会自动切换到集群中的其他节点。 这意味着工作负荷继续在幸存的节点上运行,对系统和最终用户造成最少的中断。 群集中的节点数直接影响其复原能力和可实现的存储容错类型。
设计存储体系结构时,必须选择与组织的特定空间/业务连续性需求和群集中存在的节点数保持一致的存储容错配置,确保最佳保护而不产生不必要的开销。
有关详细信息,请参阅 Azure 本地的群集设计选项。
存储
考虑支持 Azure 本地部署的存储时,选择磁盘技术在整体性能和复原能力方面起着关键作用。 固态硬盘(SSD),尤其是企业级模型,是新式 Azure 本地实例的首选标准,与传统的旋转磁盘相比,提供快速的输入/输出作和更低的延迟。 其固有速度加速了常规工作负荷响应能力和完成备份和复制任务,这是灾难恢复策略不可或缺的。
对于寻求更高性能的组织,非易失性内存 Express (NVMe) 驱动器表示高级选项。 NVMe 磁盘直接通过 PCIe 总线进行连接,绕过旧存储协议并提供无与伦比的吞吐量和降低延迟。 对于具有密集事务要求或高频率数据访问的工作负荷而言,这非常有用,如 SQL 数据库、虚拟桌面基础结构和分析作所示。
有关详细信息,请参阅 Azure 本地物理磁盘驱动器。
存储空间直连
Azure 本地使用存储空间直连进行软件定义的存储,并与故障转移群集集成。 通过使用适当的 Storage Spaces Direct 复原功能(例如,三向镜像或双重奇偶校验),Azure 本地实例可以在两个故障域(节点)之间承受磁盘故障或节点故障,而不会丢失数据或造成停机。 在存储空间直通中集成 SSD 或 NVMe 驱动器不仅能提升性能,还能增强存储子系统的容错能力。 通过将这些现代磁盘技术的速度和可靠性与存储空间直连的镜像或基于奇偶校验的恢复方案相结合,Azure 本地部署可以在发生多驱动器或节点故障时,仍然为任务关键的工作负载提供高可用性和稳定的性能。
有关详细信息,请参阅 存储空间直通概述。
网络
Azure 本地具有特定的网络要求。 每个服务器节点之间的可靠、高带宽和低延迟网络连接是稳定作的必要先决条件。 此外,每个节点应具有多个网络适配器(NIC),理想情况下会连接到每个网络角色(存储、管理、VM 流量)的多个交换机,以便实现冗余和性能。 实现提供冗余物理和逻辑网络拓扑的设计对于确保群集在发生网络交换机故障或网络适配器端口(删除单一故障点)时仍可正常运行至关重要。
有关详细信息,请参阅 Azure 本地的网络设计。
逻辑网络
在 Azure 本地中,逻辑网络用于为虚拟机创建和管理基于 VLAN 的网络,从而允许有效的网络分段和策略应用程序。 按函数和信任级别对工作负荷进行分段有助于强制实施安全边界并简化恢复规划。 此结构允许关键系统在中断期间隔离和确定优先级,从而提高连续性和降低风险。
有关详细信息,请参阅 Azure 本地的逻辑网络拓扑。
后续步骤
- 详细了解 虚拟机复原能力。