使用 PauseAfterRack 策略升级群集运行时

执行群集运行时升级时,策略 PauseAfterRack 将暂停,等待用户确认,然后再升级下一个工作器节点机架。 从 Azure CLI 升级群集运行时中讨论群集升级设置的完整列表。

先决条件

注释

从 API 版本 2024-07-01 开始,可以使用 PauseAfterRack 策略进行升级。

  1. 安装最新版本的相应 CLI 扩展
  2. 需要最新的 networkcloud CLI 扩展。 可以按照 此处列出的步骤安装它。
  3. 订阅访问权限以运行 Azure 运营商关系网络结构 (NF) 和网络云 (NC) CLI 扩展命令。
  4. 收集以下信息:
    • 订阅 ID (SUBSCRIPTION)
    • 群集名称 (CLUSTER)
    • 资源组 (CLUSTER_RG)
  5. 目标群集必须处于运行状态,且所有控制平面节点都必须健康运行。

Procedure

  1. 在 Nexus 群集上启用 PauseAfterRack 升级策略

    az networkcloud cluster update --name "<CLUSTER>" \
    --resource-group "<CLUSTER_RG>" \
    --update-strategy strategy-type="PauseAfterRack" wait-time-minutes=0 \
    --subscription "<SUBSCRIPTION>"
    
  2. 确认 JSON 视图中的群集资源 JSON 反映 PauseAfterRack 升级策略。

    az networkcloud cluster show --cluster-name "<CLUSTER>" \
    --resource-group "<CLUSTER_RG>" \
    --subscription "<SUBSCRIPTION>" | grep -A5 updateStrategy
    
     "updateStrategy": {
       "maxUnavailable": 32767,
       "strategyType": "PauseAfterRack",
       "thresholdType": "PercentSuccess",
       "thresholdValue": 70,
       "waitTimeMinutes": 15,
    
  3. 像往常一样从 Azure 门户或 CLI 触发运行时捆绑包升级。 请参阅 从 Azure CLI 升级群集运行时

  4. 控制平面和管理平面升级完成后,运行时升级将暂停,等待用户作启动 Rack 1 升级。

显示暂停运行时升级的屏幕截图。

注释

此消息在日志中可用,用于编程访问。 有关更多详细信息,请参阅 Azure 操作员 Nexus 中可用于流式传输的日志列表

  1. 若要恢复运行时升级,请执行以下 az networkcloud cli 命令。

    az networkcloud cluster continue-update-version --cluster-name "<CLUSTER>" \
    --resource-group="<CLUSTER_RG>" \
    --subscription="<SUBSCRIPTION>"
    
  2. 对每个机架重复步骤 5,直到所有机架都升级到最新的运行时捆绑包。

小窍门

在版本 2509.1 及更高版本中,可以在 Azure 门户中continue-update-version查看最新JSON View请求的状态。 信息在操作类型properties.actionStates下提供,并包含任何可用于故障排除的错误信息(如果适用)。 有关详细信息,请参阅 使用 CLI 升级群集运行时中的示例。