本文概述了 Azure 本地更新管理,包括最佳做法和常见陷阱,以帮助保持 Azure 本地安全、最新和合规。 本文适用于负责 Azure 本地部署的 IT 决策者、基础结构架构师和运营团队。
了解 Azure 本地更新管理
保持安全修补程序和功能改进对于所有 Azure 本地组件都很重要。 有关 Azure 本地更新的概述,请参阅 关于 Azure 本地更新。
Azure 本地支持通过 Azure 更新管理器(AUM)进行更新管理,该管理器提供集中式生命周期管理。 借助 AUM,可以通过单个接口跨所有 Azure 本地实例应用、查看和管理更新。
Azure 本地更新的注意事项
请遵循以下做法,确保大规模部署的 Azure 本地实例的顺利可靠更新。
查看已知问题、日志和使用故障排除指南。
- 在应用更新之前,请查看目标版本的已知问题并应用任何建议的缓解措施。 有关详细信息,请参阅 Azure 本地中的已知问题。
- 如果更新部分失败(例如,一个节点无法更新),Azure 更新管理器将报告失败。 不要盲目重新运行更新。 请按照以下步骤:
- 检索错误日志。 使用 Azure 门户中的 “更新历史记录 ”视图检查每个节点的错误详细信息。
- 检查脱机日志。 在断开连接的情况下,检查受影响节点上的事件日志(例如
ClusterAwareUpdating日志)。 - 使用故障排除指南。 Microsoft发布 Azure 本地更新的故障排除指南。 例如,步骤说明如何重试在某个阶段停滞的更新。 请遵循这些指南,根据需要重置任何更新运行状态或清除维护模式。 在重试更新之前,请确保群集稳定。 有关详细信息,请参阅 排查 Azure 本地解决方案更新问题。
使用 Azure 更新管理器。
AUM 提供了一个集中视图,用于在所有 Azure 本地实例中应用和管理更新。 在 Azure 门户中,转到 Azure 更新管理器>资源>Azure 本地。
测试环境策略。
选择一些测试群集,用于镜像生产中的 Azure 本地资源。 在应用到生产环境之前运行更新流进行验证。
使用筛选器识别准备好更新的 Azure 本地资源。
使用如下筛选器:
- 更新就绪情况 = 正常
- 状态 = 可用更新
大型环境中的批量更新。
分组聚类使用:
- 标记
- 资源组
- Subscription
- 当前版本
- 位置
定义一个模型,以分块方式进行更新。
生产环境策略。
- 使用筛选器参数创建批处理。
- 在维护时段内开始使用最小批处理进行更新。
- 如果成功,请转到下一批。
- 如果出现问题:
- 调查根本原因
- 如果需要,请联系Microsoft支持人员
- 将学习应用到未来的批处理
预下载更新内容以加快更新安装速度。
可以使用以下更新工作流预加载更新内容。 但是,静态有效负载中不包括 Azure 资源桥(ARB)和 Azure Kubernetes 服务(AKS)所需的组件。 更新过程中会自动下载它们。
只需准备工作流。 请参阅 预下载并检查更新就绪情况。
受限的网络连接更新工作流。 请参阅导入和查找具有有限网络连接的更新包。
Azure 本地更新的禁忌事项
管理 Azure 本地更新时,请避免以下做法,因为它们可能会导致错误、停机或不支持的状态。
避免在 Azure 本地计算机上手动更新。
手动更新 Azure 本地机器,或在不进行协调更新工作流的情况下更新,可能会破坏群集的感知能力并导致停机。 例如,同时对所有节点应用更新或跳过角色排空可能会破坏群集感知更新流程并导致群集 VM 宕机。
最佳做法: 始终通过 AUM 启动更新,确保滚动更新、就绪性检查和高可用性。 总之,将 Azure Local 视为群集系统,而不是作为独立服务器。
不要修改已批准的配置之外的群集节点。
避免在部署或更新之前立即对群集节点进行配置更改,因为这些更改可能会干扰自动化模板。 例如,在运行 Azure 本地部署或更新模板之前,请不要:
- 更改系统时区或区域设置
- 在节点上预安装软件更新
此类手动更改可能会导致模板验证失败或群集状态不一致。 已知问题是,应用带外的某些更新可能会导致部署出错。