你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

用于收集和查看成本数据的体系结构策略

适用于此 Azure Well-Architected 框架成本优化清单建议:

CO:03 收集和查看成本数据。 数据收集应捕获每日成本。 在成本报告中,包括产生的成本(按流量计费)、预付成本(摊销)、趋势和预测。 利益干系人应定期根据预算和成本模型审查支出。 自动执行警报,以在关键阈值触发通知,并检测异常以指示与趋势基线的偏差。

本指南介绍了收集和查看工作负荷的成本数据的建议。 收集成本数据,绘制工作负荷的整体情况,并确保支出得到优化。 数据收集包括成本优化的所有指标,例如计费数据、资源利用率和使用情况模式。

通过收集的数据,可以了解体系结构决策和业务驱动因素的成本,例如每个用户或单位的成本。 此数据让你更清楚地了解资金的去向,以及如何优化支出。 收集和查看成本数据失败可能会导致预算溢出、没有支出基线,并且对云工作负载的财务运行状况缺乏了解。

定义

术语 Definition
计费边界 帐单包括的范围。
退款 一种会计模型,在这种模型中,你向各个部门收取工作负荷使用情况的费用,并从这些部门接收付款。
资源利用率 工作负荷使用的资源容量量。
显示 一个会计模型,你在其中向部门显示其工作负荷使用情况的成本,并且你不会从他们那里收到付款。

数据收集对于识别节省成本的机会、会计(回发退款)以及高效资源使用至关重要。 必须确定来自所有相关源的成本数据的收集和评审的优先级。 应集中收集的数据,以便简化分析和定期评审、分配资源所有者,并尽可能自动执行警报。

收集成本数据

云工作负荷的有效成本管理需要全面掌握相关费用,从计算到网络使用情况。 收集的数据提供资源的使用位置和方式的精细视图。 它允许你识别效率低下、做出有关资源分配的明智决策,并最终优化成本,以确保获得投资的最佳价值。

启用数据收集。 数据收集应包括工作负荷成本的所有源,例如计算、存储、网络使用情况以及工作负荷使用的任何其他服务或功能。 数据应包括已开票和按流量计费的数据。 发票数据是 真实的。 它反映了实际计费费用。 按流量计费的数据是基于服务的计费计划预测形式的数据。 虽然仍然很有价值,但每日按流量计费的数据切片被视为 良好的估计 值,而不是精确的数字。 识别这些组件中已开票和按流量计费的数据之间的区别可以提高财务规划和分析的准确性。

使用所有可用的收集方法。 若要收集成本数据,请使用所有可用的工具和方法,例如服务提供商的成本监视和实用程序来监视工作负荷费用。 虽然这些工具通常提供有关成本明细、使用趋势和优化建议的详细见解,但它们可能不会捕获所有内容。 了解其默认功能,例如数据字典和分类。

如果特定工作负荷需要自定义视图,请设计这些视图。 除了本机工具之外,如果服务提供商提供 API,请点击它们以编程方式检索成本数据。 API 可简化自动化成本报告,并与现有管理系统无缝集成。 请记住,目标是从每个可能的源收集成本详细信息。 无论是这意味着通过 API 拉取数据、手动输入成本还是与财务系统同步,确保集中和全面的成本概述至关重要。

集中成本数据。 集中式成本数据允许更轻松地管理和分析这些数据。 它可确保你拥有统一视图,通过通用数据架构查看所有工作负荷成本,并启用更好的成本优化策略。 需要合并使用情况数据,数据应流入中央分析接收器。 可以使用云提供商提供的成本管理工具,或将数据与第三方成本管理解决方案集成。 目标是提供一个低成本的解决方案,该解决方案可由授权利益干系人轻松访问,并提供可靠的数据分析功能。

权衡:在较长时间内保留成本数据可实现历史分析和趋势识别。 但是,存储数据的成本可能很高。 为了最大程度地降低成本,请将旧数据存储为聚合数据点,而无需新数据的粒度。 此外,请根据分析需求确定最佳保留期。

为数据分组

通过分组数据,你可以获得更好的见解,以有效地管理成本。 可以根据不同的维度(例如部门或项目)分解成本,从而准确地将成本分配给相应的利益干系人。 分组数据可提升透明度、责任意识和成本意识。

将成本数据分组为有意义的类别,例如资源、服务、环境、区域、部门、项目或团队。 例如,了解资源和服务级别的成本明细有助于做出有关资源分配、缩放甚至解除授权的明智决策。 按环境(如生产、灾难恢复或质量保证)对成本数据进行分组时,它可以帮助你根据每个环境的特定需求确定成本差异并优化资源使用情况。 对工作负荷数据进行分组时,请考虑以下建议:

  • 收集使用情况和组件数据。 收集有关工作负荷中每个组件的使用情况和成本的详细信息。 可以从不同的角度分析成本,并通过捕获此数据来深入了解成本明细。

  • 查看不同的维度。 按技术维度(例如资源类型或服务类别)、资源组织维度(例如部门或团队)和业务模型维度(例如项目或成本中心)细分日常支出。 通过此细分,可以根据对特定问题或方案影响最大的维度分析成本。

  • 应用元数据。 元数据可用于对数据进行分组,并帮助生成有意义的成本报告。 它使你能够确定高成本领域,并在部门或项目级别实施问责措施或成本优化策略。 使用元数据,可以设计一种机制,以反映应用程序的核心业务模型的方式对成本进行分组。 例如,使用租户标识符标记资源,而不是多租户解决方案中的共享资源。 基于应用程序的定价模型透视成本数据的能力可以提供关键见解。

生成成本报告

收集成本数据后,需要使用它来生成成本报告。 成本报表提供对支出的可见性,并有助于分析工作负荷支出模式。 你可以确定需要成本优化的区域,并做出明智的决策以优化支出。 通过成本报表,可以将成本分配给不同的团队、部门或项目。 此分配有助于了解分配,并有助于准确退款或回发。

解决常见方案。 为工作负荷成本生成成本报告时,需要能够解决常见的成本问题。 在共同关注领域收集数据有助于确保协作解释必要的数据集,例如成本、指标和使用情况。 共同关心的领域包括:

  • 精细成本:成本报告应提供有关每个用户分配的金额和每台设备的成本的信息。

  • 资源利用率:成本报告应有助于评估当前资源是否得到充分利用并确定潜在的节省。

  • 替代解决方案:成本报表应比较过渡到新解决方案的成本和潜在节省。 它们还应评估切换到动态解决方案的可行性。

  • 投资回报:成本报告应有助于确定收入进入系统作的百分比。 如果系统没有增加收入,则应测量其他 ROI 指标。

  • 支出模式:成本报表应分析支出模式,以确定一段时间内成本的趋势和模式。 支出模式有助于做出有关成本优化和预算规划的明智决策。

符合会计标准。 成本报表应符合内部会计标准。 常见系统是回显和退款。 显示是关于可见性的,退款是关于责任的。

  • 显示 是指在整个组织中提供成本可见性,而无需为单个团队或部门收取云成本。 可以使用成本报告生成显示报表,以展示每个团队或部门产生的成本。 例如,营销团队利用了 15,000 美元,而工程部门因总工作负荷支出 40,000 美元而产生 25,000 美元的成本。 Showback 为每个部门提供成本明细,使每个团队能够查看和优化其资源消耗。 这些报表提供透明度,并使利益干系人能够了解其使用情况和相关成本。

  • 退款 涉及根据其实际使用情况为其各自的云成本计费内部团队或部门。 退款是双面的。 你可以根据呈现的资源消耗和服务向其他人收费。 例如,工作负荷使用集中式安全服务。 一个月来,安全团队向你收取了 10,000 美元的服务费用。 但是,你分别向销售和营销部门收取 7,000 美元和 8,000 美元,用于使用工作负荷。 所有退款交易(信用和借方)都集成到集中式成本数据接收器中。 退款可确保每个费用都计入并纳入组织的财务管理中。 它提供整体视图,促进部门间成本的优化。

提供全面的报告。 成本报告应包括云服务和供应商的成本。 报告应包括产生的成本(已开票)、预付成本(摊销)、趋势、预测、信用额度和成本差异。 在显示和退款系统中,成本报告应包含以下元素:

  • 产生的成本:产生的成本是指根据按流量计费的使用情况累积的实际成本。 这些成本是根据特定计费周期内资源或服务的消耗量计算的。

  • 预付成本:预付成本是提前支付的费用,并在特定时间段内分散。 这些成本通常在预付费期期间进行摊销或均匀分配。

  • 趋势:分析成本趋势涉及检查历史数据,以确定随时间推移的支出模式和变化。 此分析可帮助你了解成本如何波动并识别任何基础因素。

  • 预测:成本预测根据历史数据和趋势预测未来支出,使你可以相应地估算未来的成本和计划。 可以使用各种技术(如机器学习算法)生成预测。

  • 额度:服务提供商通常为服务提供额度(免费利用)。 成本报告应包括信用余额和使用情况,以正确了解支出需求。

  • 成本差异:成本报告中的成本差异是指实际成本与预期成本或预算成本之间的差异。 它有助于识别与计划成本的偏差,并了解其背后的原因。

分配资源所有者

每个成本项都应有一个直接负责的个人(DRI)作为 资源所有者。 将资源所有者分配给每个成本项可确保明确相关成本的责任。 它有助于确定谁负责管理和优化特定资源或服务的使用情况和成本。 资源所有者对于以下事项非常重要:

  • 成本分配:将资源所有者分配给每个成本项可实现准确的成本分配。 资源所有者确保成本归因到适当的团队、部门或项目,从而促进财务透明度和预算管理。

  • 通信:分配资源所有者可促进工作负荷团队和组织内的有效通信和协作。 它有助于讨论成本管理、鼓励共享最佳做法,并使资源所有者能够协同工作,共同优化成本。

  • 决策:资源所有者在与资源预配、缩放和优化相关的决策中发挥关键作用。 他们具有必要的见解和所有权,以便做出符合业务目标和成本优化目标的明智决策。 资源所有者可以主动监视和分析与其资源相关的成本。 他们可以确定节省成本的机会,优化资源使用情况,并做出控制并降低成本的决策。

查看成本数据

使用利益干系人定期审查预算和成本模型的支出。 定期评审有助于确定成本趋势、离群值和优化领域。 在这些评审中,必须让利益干系人(如财务团队、运营团队和决策者)参与,以推动成本优化计划。 评审确保成本符合预期,并在必要时进行调整。 监视使用模式的更改、根据需要调整资源分配,并根据持续分析成本数据实施节约成本措施。

分析成本数据

查看从工作负荷收集的成本数据,以深入了解支出模式。 评审可能包括分析资源利用率、识别成本驱动因素,以及了解工作负荷的不同组件的成本分布。 还应注意成本的增加和降低,例如计算使用情况和网络传输成本。 查找可在不牺牲性能或功能的情况下优化成本的区域。 例如,识别未充分利用的资源、初始化实例或云提供商提供的成本节省功能。

查看体系结构选择

在检查工作负荷的体系结构决策时,必须专注于成本影响。 利用替代模式或云原生产品/服务可以节省大量成本。 通过基础结构即服务(IaaS)选择平台即服务(PaaS)或软件即服务(SaaS)可能更经济。 通过 PaaS,不仅基础结构费用是服务定价的一部分,而且平台还简化了这些资源的预配和管理,成本统一。 例如,将较低层虚拟机部署为跳转盒可能会为存储、服务器管理和公共 IP 配置带来额外的成本。 相比之下,PaaS 会处理这些复杂性,提供一种综合成本,通常包括增强的安全性。

自动执行成本警报

实现自动警报可以在关键阈值触发预算通知。 可以设置这些警报,以在成本超出预定义限制或与预期支出模式存在重大偏差时通知利益干系人和 DRIs。 预算警报和预测警报是用于自动执行成本警报的两种不同类型的成本警报。

使用预算警报。 预算警报允许你设置预算金额并定义实际成本的阈值。 当实际成本超过指定的阈值时,将触发预算警报。 这些警报有助于监视支出,并在接近或超出预算时通知你。 预算警报基于你累积的实际成本。 工作负荷支出往往有所不同。 你至少应按预期成本(100%)、理想支出(90%)和低于理想支出(110%)为目标预算设置警报。

使用预测警报。 预测警报在支出趋势可能超出预算时提供高级通知。 这些警报基于预测的成本预测生成。 当预测的成本超过设定的阈值时,将触发预测警报。 预测警报可帮助你预测潜在的成本溢出,以便采取主动措施来控制支出。 应将预测警报设置为目标预算的 110%。

使用异常情况检测。 异常情况检测有助于识别成本数据中的意外模式或异常模式,让你能够及时检测和解决成本异常。 利用异常情况检测技术来识别与趋势基线的偏差,例如意外的峰值或成本下降,并采取适当的措施。 你应该调整异常情况检测,以捕获支出防护措施无法或间歇性地阻止的波动。

根据成本异常的分析,确定解决这种情况的必要作。 行动计划可能包括优化资源利用率、调整虚拟机大小、实施 Azure Policy 控制或调整预算。 请务必将成本控制措施与业务价值保持一致,并获取对预算调整的必要批准。

实现自动化流程,实时识别和解决成本差异。 选项包括自动缩放资源、自动关闭或建立用于调查和缓解成本异常的工作流。 建立关键绩效指标(KPI),以衡量成本预测的准确性、成本与预算、意外异常数以及响应预测警报的时间。 定期查看预测、跟踪差异,并确保与预算预期保持一致。

风险:自动收集和审查成本数据可以节省时间和精力。 但是,仅依赖于自动化可能会忽略需要手动评审和分析的某些成本优化机会。 在自动化和手动评审之间找到正确的平衡至关重要。

Azure 便利化

收集和分组成本数据:Azure 提供 成本分析和 Azure 顾问等服务,可帮助跟踪和分析 Azure 支出和使用情况。 这些服务捕获必要的数据来准确计算成本。 使用 Azure 标记对成本进行分组,以便与不同的业务部门、工程环境和成本部门保持一致。 标记提供企业跨不同组管理和分配成本所需的可见性。

生成成本报告成本分析 提供可自定义的报表,提供对所产生成本、预付成本、趋势和预测的见解。 这些报表可以根据具体要求定制,并提供成本的综合视图。

查看成本数据Microsoft Power BI 可帮助收集和查看成本数据。 Power BI 提供了一个全面的解决方案,用于收集、审查和分析成本数据。 它使你能够有效地获取见解、跟踪趋势和优化成本。 它与成本管理集成,使你能够将成本数据导入 Power BI。

对于较小的成本数据集,可以使用 使用情况详细信息 API 以编程方式检索与 Azure 帐单相对应的原始未聚合成本数据。

查看体系结构设计选择:Azure 提供了广泛的 PaaS 资源。 下面是可能考虑 PaaS 选项的一些示例:

任务 Use
托管 Web 服务器 Azure 应用服务 ,而不是设置 IIS 服务器。
索引和查询异源数据 Azure 认知搜索 而不是 ElasticSearch。
托管数据库服务器 Azure 提供了许多 SQL 和无 SQL 选项,例如 Azure SQL 数据库和 Azure Cosmos DB。
保护对虚拟机的访问 Azure Bastion 而不是虚拟机作为跳转框。
网络安全 Azure 防火墙 ,而不是虚拟网络设备。

自动化警报:成本管理使你能够基于支出阈值或预算设置 自动警报和作 。 当成本超出预定义限制或偏离预期模式时,这些警报可能会触发对利益干系人通知。 应使用 成本分析 来查看和响应成本异常。 此功能可以突出显示意外的峰值或成本下降,从而及时进行调查和作。

优化日志分析成本:对于生成大量日志卷的高流量服务,请实施 引入时转换 ,以有选择地处理和存储相关数据。 例如,Azure 防火墙支持在日志存储之前进行高级筛选和数据转换,从而节省日志分析费用,同时保留与安全相关的事件进行分析。 配置筛选规则以保留关键安全事件,同时减少大容量环境中的常规流量日志。

成本优化清单

请参阅完整的建议集。