适用于:Azure Local 2311.2 及更高版本
Azure Local 的 OS 运行状况服务持续监视 Azure Local 系统,以检测各种组件(例如物理和虚拟磁盘、存储池容量、卷容量、网络接口、存储 QoS、虚拟机 (VM) 和 VHD)中的 80 多个运行状况问题。 它提供了有关受影响组件的信息,包括原因、问题发生的时间以及缓解问题的建议。 可以查看运行状况问题,例如不受支持的硬件、无响应的磁盘、错误的块写入、分离的驱动器、修复需求、超出 CPU、内存和存储使用量,以及高延迟。 有关所支持的运行状况故障的完整列表,请参阅查看运行状况故障。
本文介绍如何使用 Azure Monitor 警报来主动识别、通知和响应 Azure Local 运行状况警报。
Azure Local 运行状况警报与 Azure Monitor 集成
Azure Monitor 警报与 Azure Local 的集成增强了 Azure Local 的运行状况警报功能。 通过这种集成,在本地 Azure Local 系统中生成的任何运行状况警报都会被自动转发到 Azure Monitor 警报。 可以将这些警报与自动化事件管理系统连接起来,从而确保及时高效地做出响应。
有关 Azure Monitor 警报的详细信息,请参阅什么是 Azure Monitor 警报?。
优点
Azure Monitor 警报与 Azure Local 的集成带来了几个主要好处:
没有任何额外费用。 启用运行状况警报功能后,就会自动获得有关所有 Azure Local 系统运行状况问题的 Azure Monitor 警报,而无需支付额外费用。 无需设置日志分析或手动编写任何警报规则。
准实时监视。 借助 Azure Local 运行状况警报提供的近乎实时的监控功能,可以在问题发生时及时发现并立即采取措施,从而减少停机时间。
可定制性。 Azure Local 运行状况警报体验建立在 Azure Monitor 警报之上。 可以配置警报处理规则,通过首选的事件管理合作伙伴通知正确的团队,从而确保对问题做出快速有效的响应。
先决条件
以下是使用 Azure Local 运行状况警报的前提条件:
- 有权访问已部署和注册的 Azure 本地系统。 有关详细信息,请参阅通过 Azure 门户部署 Azure Local。
为 Azure Local 配置运行状况警报
以下是为 Azure Local 配置运行状况警报的高级步骤:
- 步骤 1:开启运行状况警报功能。
- 步骤 2:配置警报处理规则。
步骤 1:开启运行状况警报功能
通过 Azure 门户启用警报时,Azure Monitor 扩展会在后台安装。 要验证此扩展是否已安装,请转到 Azure 门户中的设置>扩展。 该扩展在扩展列表中显示为 AzureEdgeAlerts。
请按照以下步骤通过 Azure 门户打开运行状况警报。
转到 Azure Local 系统资源页并选择群集。 在“功能”选项卡下,选择“运行状况警报”磁贴。
在右侧“打开运行状况”窗格中,选择“开启”按钮。
Azure Monitor 警报扩展会在后台开始安装。
成功安装扩展后,你将看到“功能”选项卡。确认“功能”选项卡下的“运行状况警报”磁贴现在显示为“已配置”。
步骤 2:配置警报处理规则
在此步骤中,可以配置警报处理规则,该规则由一系列配置和操作组成,用于确定如何处理收到的警报。 通过这些规则,可以添加或禁止操作组、应用筛选器或指定应用规则的预定义时间表。
以下是如何配置警报处理规则以处理 Azure Local 运行状况警报的一些常见用例:
- 配置操作组,以确定接收通知的对象和发送通知的类型。 通知可通过电子邮件、短信或两种方式发送。
- 指定所有与存储相关的运行状况故障警报都应发送给负责解决存储问题的团队。
- 配置何时应用规则。 默认情况下,规则始终处于活动状态。 你可以将其设置为在特定时间工作,也可以设置一个定期计划。
有关警报处理规则和如何配置这些规则的信息,请参阅警报处理规则和配置警报处理规则。
查看运行状况警报
在 Azure 门户中,可以通过监控>警报边栏选项卡实时查看 Azure Local 系统的运行状况警报。
“警报”边栏选项卡提供各个严重性级别的警报的高级摘要。 你可以向下钻取,查看每个严重性级别的各个警报。
修改健康警报阈值
可以通过 PowerShell 修改某些运行状况警报的阈值,例如 CPU、内存、存储使用情况。 有关详细信息,请参阅 修改健康服务设置。
若要查看不同健康故障的当前阈值设置,请运行以下命令:
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name <SettingName>
例如,若要查看存储容量警告和临界阈值,请运行以下命令:
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Warning"
Get-StorageSubSystem Cluster* | Get-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Critical"
若要将阈值更改为所需设置,请运行以下命令:
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name <SettingName> -Value <Value>
例如,若要更改存储容量警告阈值,请运行以下命令:
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.Volume.CapacityThreshold.Warning" -Value 70
禁用运行状况警报
要禁用运行状况警报功能,请卸载之前安装的 Azure Monitor 警报扩展。
有关说明,请参阅从 Azure 门户卸载扩展。
后续步骤
查看运行状况警报列表,你可能会在 Azure Local 系统中遇到这些运行状况警报。



