你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

用于定义性能目标的体系结构策略

适用于此 Azure Well-Architected 框架性能效率清单建议:

PE:01 定义性能目标。 性能目标应为与工作负荷要求关联的数值。 应为所有工作负荷流实现性能目标。

本指南介绍了有关建立和公开性能目标的建议。 性能目标是定义性能目标的指标。 这些指标表示为单个数值或数值范围。 它们明确且特定的指标,可推动持续改进。 性能目标是改进的数字基础,可帮助团队将努力与特定目标保持一致。 如果没有明确的性能目标,团队可能缺乏对性能问题的专注和缺乏责任。 通过设置性能目标,团队可以致力于特定目标并推动持续改进。

定义

术语 Definition
数据流 在系统内或系统之间移动数据。
Dependency 工作负荷所依赖的组件。
Flow 在工作负荷中,执行特定函数的一系列作。 它涉及数据移动和工作负荷组件之间的进程运行。
Metrics 定期收集的数值。 指标描述特定时间系统的某些方面。
性能目标 定义性能目标的指标。 这些指标表示为单个数值或数值范围。
用户流 用户在应用程序或系统中执行的作的路径或序列。
Workflow 工作负荷运行以完成任务的步骤序列。

建立性能目标是实现工作负荷性能效率的重要步骤。 性能目标定义工作负荷所需的性能级别,并帮助你衡量其达到这些目标的有效性。 性能目标提供了一个基准来衡量和比较工作负荷的效率。 此基准可帮助你突出显示改进领域。 这些目标还使任务与组织的目标保持一致,并增强业务成果。 此外,性能目标提供资源分配方面的指导,有助于确保工作负载能够适应不同的需求,同时保持最佳性能。

提前设置性能目标

在部署工作负荷之前设置性能目标。 对于设计中的工作负荷,性能目标需要研究。 进行市场研究、竞争分析和调查,以生成性能目标范围。 对于没有性能目标的生产工作负荷,请使用生产数据和客户反馈来建立性能目标。

确定性能要求

确定性能要求是确定对应用程序至关重要的基本性能指标,例如响应时间、吞吐量和延迟。 将这些性能目标与组织的业务目标保持一致,可确保工作负荷满足所需的标准,无论是针对一流的还是平均产品。 例如,你可能的目标是减少响应时间、提高吞吐量速率或优化资源使用。

设置性能目标时,必须使组织的目标与用户群的不同需求保持一致。 用户最终确定性能的成功,强调需要将性能目标与其期望保持一致。 这种平衡可确保性能目标捕获预期的用户体验和工作负荷的整体效率。 若要全面衡量和优化工作负荷性能,应考虑为以下列表设置性能目标:

  • 单个组件:单个组件是工作负荷的单独单元或段,每个组件可能具有不同的性能属性和需求。

  • 用户流:这些路径绘制了用户如何纵工作负载,并确保其流畅性直接增强用户体验。

  • 工作流:定义的工作流内部流程经过精心设计,以实现特定结果,并且通常决定运营效率。

  • 数据流:数据流是指工作负荷中的数据移动和交互,帮助识别潜在的效率低下或瓶颈。

  • 外部依赖项:外部依赖项是主工作负荷(集成的第三方服务或工具)之外的元素,可显著影响性能。

  • 缩放单元:缩放单元与工作负荷的可缩放段相关。 在增加的负载下确保可靠的性能至关重要,尤其是在增长方案中。

  • 技术级别:技术级别是直接性能指标,例如 API 访问速度、数据库作延迟和潜在的网络延迟。

  • 业务交易:业务交易表示端到端用户作,例如完成购买或预订服务,其无缝执行直接绑定到用户满意度。

  • 工作负荷全部增加:此整体指标概述了包含工作负荷的所有组件和方面的集体性能。

确定关键指标

确定关键性能指标涉及确定跟踪实现工作负荷性能目标的进度的基本度量。 此标识提供了一种可量化的方式来衡量和提高性能效率。 确定要关注的关键指标时,请考虑与可用性、容量和响应时间相关的指标:

  • 可用性:错误率是可用性性能指标。 错误率表示一段时间内失败请求的百分比。 错误率的常见目标是 0.1%% 的请求。

  • 容量:吞吐量和并发是示例容量指标。 吞吐量是指能够在给定时间段内处理特定数量的事务。 例如,应用程序可能需要每月持续 1 亿个事务。 并发是同时用户或作的度量值。

  • 响应时间: 延迟和加载时间是常见的响应时间指标。 延迟是响应请求(200 毫秒)所需的时间。 加载时间是应用程序或网页交互所需的时间。 常见目标是完成不到 1 秒的登录请求的 99%。

设置特定目标

确定关键指标后,需要为每个指标指定性能目标或阈值。 性能目标应可度量、真实且符合工作负荷目标。 例如,可以设置小于 500 毫秒(ms)的目标响应时间或目标错误率小于 1%。 避免对性能进行定性评估,例如 快速缓慢。 通过使用数字目标,可以客观地评估一段时间内的性能。 设置特定的性能目标时,请考虑以下建议:

  • 考虑客户:设置性能目标时,采用以客户为中心的视角。 将客户识别为性能的最终判断有助于确保性能目标符合客户预期。 这种一致性涉及考虑组织目标和客户群的不同要求。 在集成这两个方面时,可以定制性能目标,以反映所需的客户体验和整体工作负荷有效性。 通过定义考虑客户期望的性能目标,你可以努力提供高质量的客户体验并满足客户的需求。

  • 使用百分位:百分位数(如 P99、P95 和 P50)是表示性能评估结果的行业标准。 百分位数是指示数字包含的数据量的度量值。 例如,P99 涵盖 99 个数据%。 使用百分位数(而不是简单的平均值)来更全面地了解工作负荷性能。 若要度量百分位数,请收集一段时间内的性能数据,通常使用监视工具或日志记录机制。 然后分析此数据,以确定不同百分位的响应时间值。

记录并公开性能目标

记录和公开性能目标是记录集中位置中的所有性能目标。 满足性能目标是开发和运营团队之间的共同责任。 为了确保工作负荷一致满足或超过这些目标,请向团队提供采取作的信息和访问权限。 若要记录并公开性能目标,请考虑以下建议:

  • 文档性能目标:记录所有性能目标。 确保所有性能目标都记录在集中的位置,并且可由开发和运营团队轻松访问。 它促进对齐,并有助于实时决策。

  • 公开性能目标:所有负责任的团队都应能够查看和创建性能目标中的可作任务。 使用信息辐射器(如仪表板和报表)使性能目标易于访问。

  • 使其可作:文档和信息辐射器应建议明确的后续步骤。 例如,错误增加可能会提示立即进行检查,或者一致地达到目标可能会建议重新评估该基准。

评估客户反馈

评估客户反馈涉及积极寻求和分析客户的响应和建议。 积极收集和分析客户反馈,提供有关其需求和期望的宝贵见解。 常规通信有助于根据不断变化的偏好和技术趋势调整性能目标。 关注客户需求意味着工作负载不仅符合技术基准,而且需要持续优化。 此方法强调客户满意度,可确保工作负载在从长远来看保持相关且成功。

Azure 便利化

设置性能目标:Azure 顾问提供可通知性能目标 的性能建议

Azure Monitor 是一项全堆栈监视服务,提供一组完整的功能来监视 Azure 资源并衡量性能目标。 它收集平台指标并提供随时可用的仪表板。 它允许基于指标配置警报。 它还存储和关联指标,以确保单个事实来源。

Azure 网络观察程序 可用于跨 Azure 基础结构建立和监视性能目标。 使用 连接监视器 通过持续综合测试和诊断来测量延迟和数据包丢失。 使用 流量分析 分析流日志并发现带宽使用情况和流量模式的趋势。 在两个工具中生成自定义工作簿,以可视化性能指标、跟踪基线并支持正在进行的性能评估。

性能效率清单

请参阅完整的建议集。