你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

管理和监视 Oracle Database@Azure

本文提供有关 Oracle Database@Azure 部署的管理和监视指南。 这些建议在 Oracle Database@Azure 基础结构中实现全面可视化、主动解决问题和优化性能,同时与 Azure 原生监控功能进行集成。

Oracle Database@Azure需要跨数据库、基础结构和安全层进行协调监视。 实施这些建议以建立可靠的监视做法,以支持 Oracle 自治Database@Azure和 Oracle Exadata Database@Azure 服务的卓越运营和业务连续性。

建立全面的监视策略

实现三层监控方法,可提供跨数据库操作、基础设施健康状况和安全态势的可见性。 此综合策略可确保完整的运营覆盖范围,同时避免监视差距。

  1. 部署三层监视体系结构。 Oracle Database@Azure在三个不同的层中协同工作以提供监视功能,从而实现全面的运营可见性。 部署所有三个层以确保全面覆盖。 此覆盖范围包括通过 Azure Monitor 进行虚拟机(VM)群集监视、通过 Azure Monitor 和 Log Analytics 进行诊断日志收集,以及通过已启用 Azure Arc 的服务器进行单个 VM 监视。 有关 Azure Arc 集成指南,请参阅 Oracle Database@Azure的 Azure Arc 连接设计

  2. 为 VM 群集指标配置 Azure Monitor。 设置 Azure Monitor 以收集特定于 Oracle Database@Azure部署类型的群集级性能指标。 将 Oracle Exadata VM 集群指标用于 Exadata 部署用于标准集群的 Oracle VM 集群指标,以及 用于自治数据库部署的自治数据库指标

  3. 启用诊断设置以提高可观测性。 配置 Oracle Database@Azure 的诊断设置,以收集全面的操作数据。 此配置通过 Azure Monitor 和 Log Analytics 捕获 Exadata VM 群集生命周期管理日志、数据库日志、基础结构日志和 Data Guard 日志,以便进行集中分析。

  4. 集成 Azure Arc 进行基础结构监视。 启用 已启用 Azure Arc 的服务器监视 ,以监视群集中每个 VM 上的作系统级别指标、安全事件和符合性状态。 此集成提供统一的治理,同时保留现有 OCI 控制台针对数据库特定操作的功能。

配置关键性能监控

针对直接影响业务运营的关键绩效指标建立主动监视。 配置警报和阈值,以便在问题影响服务可用性之前提前检测问题。

  1. 使用适当的阈值监视数据库性能指标。 使用经过验证的阈值配置关键数据库指标的监控,以指示潜在问题。 将 CPU 利用率监视设置为 90% 阈值,收集频率为 5 分钟,存储利用率为 90%,频率为 30 分钟,内存使用率为 90%,频率为 15 分钟。 有关完整的指标规范,请参阅 数据库和群集指标参考表

  2. 为基础结构运行状况实现 Azure Arc 代理监视。 监视 Azure Arc 代理连接和运行状况,以确保持续管理功能。 使用 5 分钟的频率配置 Azure Arc 代理状态监视,并立即针对断开连接状态发出警报、启用了 Azure Arc 的服务器运行状况监视(频率为 10 分钟)和 Azure Policy 符合性监视,以 30 分钟的频率进行配置偏移检测。

  3. 创建统一的监视仪表板。 在 Azure 门户中生成一个自定义仪表板,用于聚合来自所有三个监视层的指标。 此统一视图为操作员提供了跨数据库性能、基础结构运行状况和安全状态的完整可见性,而无需在多个工具之间切换。

  4. 为事件响应配置警报动作组。 设置Azure Monitor 操作组,在超出关键阈值时自动通知相关方。 根据警报严重性和类型配置协调数据库管理员、基础结构团队和安全人员的升级过程。

集成安全监视功能

通过集成监控,将 Azure 原生安全工具与现有的 Oracle 安全做法相结合,提高作业安全性。 此集成提供全面的威胁检测,而无需重复现有的安全投资。

  1. 部署 Microsoft Defender for Cloud 集成。Defender for Cloud 与 Oracle Database@Azure 基础结构集成,以提供全面的威胁检测和安全态势管理。 此集成通过 Azure 原生威胁智能和自动化响应功能增强了现有的 Oracle 高级安全功能。

  2. 创建统一的安全监视仪表板。 使用 Azure Monitor 工作簿 构建安全监视,这些工作簿结合了 Microsoft Defender 安全警报、Oracle Enterprise Manager 安全监视、OCI 安全组事件和 Azure Arc 基础结构符合性状态。 这种统一的方法提供跨两个平台的完整安全可见性。

  3. 实现自动威胁响应工作流。 使用 Oracle 特定的注意事项配置 Defender 工作流自动化和安全事件响应过程。 设置自动化虚拟机隔离,以确保在安全事件期间数据库的可用性,并创建事件工单,其包括 Azure 安全上下文和 Oracle 操作影响评估。

  4. 监视安全指标以确保合规性。 跟踪Defender 威胁检测状态,频率为每 5 分钟一次用于活跃威胁,安全基线合规性分数每小时一次,阈值为 80%,以及漏洞评估状态,每天监控高危和严重漏洞。

有关全面的安全指南,请参阅 Oracle Database@Azure的安全指南

设计 Log Analytics 工作区策略

配置 Log Analytics 工作区,以补充现有的 Oracle 监视,同时提供集中式分析功能。 设计支持合规性要求和运营效率的工作区体系结构。

  1. 根据合规性要求规划工作区隔离。 设计符合现有 Oracle 审核和符合性要求的 Log Analytics 工作区 体系结构。 对于可能影响日志存储和分析功能的不同环境(生产、开发、测试)和数据驻留要求,请考虑工作区隔离。

  2. 配置符合 Oracle 审核要求的日志保留策略。 设置满足组织合规性要求的日志保留策略,同时优化存储成本。 将 Azure Monitor 日志保留与现有的 Oracle 审核日志保留策略保持一致,以确保这两个平台的合规性覆盖率一致。

  3. 在平台之间建立明确的监视边界。 定义通过 OCI 处理的数据库级监视与通过 Azure Arc 处理的 VM 基础结构监视之间的明确边界。这种分离可防止监视重叠,同时确保所有系统组件的完全覆盖。

  4. 使用基于角色的权限实现工作区访问控制。 使用符合现有组织职责的 Azure Monitor 角色和权限 配置工作区访问权限。 确保数据库管理员对数据库指标具有适当的访问权限,而基础结构团队可以访问 VM 级监视数据。

规划迁移监控集成方案

使用迁移规划协调监控能力,以确保数据移动操作期间的可见性。 配置支持所选迁移方法的监控,同时保持运营监督。

  1. 将监控与迁移方法相一致。 配置监视以支持所选的迁移方法,无论是使用 Oracle 恢复管理器、Oracle 数据防护、Oracle 数据泵还是具有网络文件系统(NFS)角色的 Linux VM。 每个迁移方法都需要特定的监视重点区域,以确保数据移动和验证成功。

  2. 根据需要跨 Azure 区域扩展监视。 如果 Oracle Database@Azure部署跨越多个 Azure 区域,请评估现有监视工具是否可以将功能扩展到新区域。 规划监视工具分发,并确保跨所有部署区域无缝集成和功能。

  3. 与 Oracle 和Microsoft代表协调进行迁移监视。 在迁移规划期间让 Oracle 和Microsoft代表参与,以确保监视配置支持迁移验证和回滚过程。 这种协调可确保监视功能与迁移时间线和成功条件保持一致。

  4. 记录用于利益干系人沟通的监控集成点。 创建文档,确定不同警报类型的关键利益干系人并建立明确的通信过程。 将监视警报映射到相应的响应团队,并定义协调数据库管理员、基础结构团队和业务利益干系人的升级过程。

数据库和群集指标

下表包含 Oracle Database@Azure 指标的建议设置。 针对群集中所有可用节点配置这些指标的警报,以确保全面的监视覆盖范围。

指标名称 收集频率 阈值 DESCRIPTION
CPU 使用率 5 分钟 90% 针对数据库可用 CPU 报告的跨所有使用者组聚合的 CPU 使用率百分比
存储利用率 30 分钟 90% 所有表空间中已使用的预配存储容量的百分比
闪存恢复区域利用率 15 分钟 90% 闪存恢复区域使用情况百分比
内存使用情况 15 分钟 90% 总内存池消耗量
进程限制的使用情况 5 分钟 90% 数据库进程限制使用率百分比
会话限制利用率 5 分钟 90% 数据库会话限制使用情况百分比
OCI 数据库群集内存利用率 5 分钟 90% Exadata 数据库群集的内存消耗
平均节点状态 5 分钟 0 (错误) Exadata 数据库群集节点的可用性状态

有关更多信息,请参阅 Oracle Cloud Database 指标

已启用 Azure Arc 的服务器指标

为 Oracle Database@Azure 基础结构启用 Azure Arc 后,监视以下 VM 级别组件以补充现有群集和数据库监视。

指标名称 收集频率 阈值 DESCRIPTION
Azure Arc 代理状态 5 分钟 0 (断开连接) 群集中每个 VM 上的 Azure Arc 代理的连接状态
已启用 Azure Arc 的服务器运行状况 10 分钟 Unhealthy 总体健康状况,包括扩展健康状况和资源状态
Azure Policy 合规性 30 分钟 非符合性 操作系统级别配置的策略合规状态

有关详细信息,请参阅 使用 Azure Monitor 监视已启用 Azure Arc 的服务器

安全监视指标

当 Defender for Cloud 与 Oracle Database@Azure基础结构集成时,监视以下以安全为中心的指标。

指标名称 收集频率 阈值 DESCRIPTION
Defender 威胁检测状态 5 分钟 任何现有的活动威胁 活动威胁检测和安全警报的状态
安全基线符合性分数 1 小时 小于 80% Defender 评估的总体安全合规性分数
漏洞评估状态 Daily 高危/严重漏洞 已识别漏洞的计数和严重性

Azure 工具和资源

类别 Tool DESCRIPTION
监测 Azure Monitor 全面监控Oracle Database@Azure指标的平台
可视化 Azure Monitor 工作簿 统一监控视图的自定义仪表板
Log Analytics Log Analytics 工作区 集中式日志分析和保留
警报 Azure Monitor 操作组 自动通知和响应工作流
安全性 云端保护者 (Defender for Cloud) 集成的安全监视和威胁防护
混合管理 已启用 Azure Arc 的服务器 Oracle VM 的基础结构监视和管理
Compliance Azure Policy 配置符合性和管理政策