你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
从规划开始,有效地管理 Azure AI Foundry 成本。 本文介绍如何在部署前估算费用、实时跟踪支出,以及设置警报以避免预算意外。
你将了解的内容:
- 使用 Azure 定价计算器估算成本
- 监视不同模型类型的实际支出
- 创建预算和警报来控制支出
- 了解 Azure 托管模型与合作伙伴模型之间的计费差异
本文介绍如何规划和管理 Azure AI Foundry 的成本。 首先,使用 Azure 定价计算器来帮助规划 Azure AI Foundry 成本,然后再添加资源。 接下来,在添加 Azure 资源时,查看预估成本。 开始使用 Azure 资源后,请使用成本管理功能来设置预算并监视成本。
小窍门
Azure AI Foundry 在 Azure 定价计算器中没有特定页面。 Azure AI Foundry 由其他几个 Azure 服务组成,其中一些服务是可选服务。 本文介绍如何使用定价计算器来估算这些服务的成本。
在 Azure AI Foundry 门户中使用 Azure AI 服务。 Azure AI 服务的成本只是 Azure 账单中每月成本的一部分。 你将针对 Azure 订阅中使用的所有 Azure 服务和资源(包括第三方服务)计费。 还可以查看预测的成本,并确定支出趋势,以查找你可能想要采取行动的领域。
先决条件
若要查看和分析成本,需要:
- 具有读取成本管理数据权限的 Azure 账户
- 支持的 Azure 帐户类型之一
需要授予访问权限? 了解如何 分配对成本管理数据的访问权限。
使用 Azure AI 服务之前估算成本
添加 Azure AI 服务之前,请使用 Azure 定价计算器估算成本。
在 Azure 定价计算器中选择产品,例如 Azure OpenAI。
输入计划使用的单位数。 例如,输入输入令牌数。
选择多个产品来估算多个产品的成本。 例如,搜索并选择 Azure AI Search 以添加潜在成本。
向项目添加新资源时,请返回到此计算器,并在此处添加相同资源来更新成本估算。
与 Azure AI Foundry 关联的成本
创建 Azure AI Foundry 资源时,需付费使用 Azure OpenAI、语音、内容安全、视觉、文档智能和语言等服务。 成本因每项服务及其中的某些功能而异。 在 Azure AI 服务 定价页上查找更多详细信息。
了解 Azure AI 服务的计费模型
Azure AI 服务运行在 Azure 基础结构上,部署新资源时会产生成本。 请务必了解额外的基础结构可能会产生成本。 对已部署的资源进行更改时需要管理该成本。
创建或使用 Azure AI 服务资源时,会根据所使用的服务付费。 Azure AI 服务提供了两种计费模型:
无服务器 API:使用无服务器 API 定价时,会根据所使用的 Azure AI 服务,根据其计费信息向你计费。
承诺层:通过承诺层定价,你承诺使用多个服务功能支付固定费用,因此,可以根据工作负荷的需求获得可预测的总成本。 根据所选计划向你计费。 有关可用服务、如何注册以及购买计划时的注意事项的信息,请参阅 快速入门:购买承诺层定价。
注释
如果您使用的资源超出承诺计划提供的配额,您需要根据您在 Azure 门户中购买承诺计划时列出的超额用量支付额外费用。
了解 Foundry 模型的计费模型
基于令牌的定价
语言模型通过将输入分解为令牌来理解和处理输入。 作为参考,对于典型的英文文本,每个标记大约是四个字符。 处理图像或音频的模型也会将它们分解为令牌,以便进行计费。 每个图像或音频内容的令牌数取决于模型和输入分辨率。
每个令牌的成本因所选模型系列而异,但在所有情况下,在 Azure AI Foundry 中部署的模型按 1,000 个令牌收费。 例如,Azure OpenAI 聊天完成模型推理 按 1,000 个令牌按不同的费率收费 ,具体取决于模型和部署类型。 对于大多数模型,定价现在以 100 万个令牌列出。
令牌成本是针对输入和输出计算的。 例如,假设你有一个 1,000 个标记的 JavaScript 代码示例,要求模型转换为 Python。 您为发送的初始输入请求支付大约 1,000 个令牌,为接收到的响应输出再支付 1,000 个令牌,总共支付 2,000 个令牌。
实际上,对于这种类型的完成调用,令牌的输入和输出并不是完全对等的。 从一种编程语言转换为另一种编程语言可能会导致较长或更短的输出,具体取决于许多因素。 其中一个因素是分配给 max_tokens 参数的值。
由 Azure 直接销售的模型
由 Azure 直接销售的模型(包括 Azure OpenAI)将直接收费。 它们显示为每个 Azure AI Foundry 资源下的计费指示器。 Microsoft直接处理此计费。 检查账单时,您会看到用于计算每个已用模型输入和输出的计费计量器。
来自合作伙伴和社区的模型
第三方提供商(如 Cohere)提供的模型使用 Azure 市场计费。 与 Microsoft 计费表不同,这些条目是与 Azure AI Foundry 资源部署所在的资源组相关联,而非与 Azure AI Foundry 资源本身相关联。 由于模型供应商直接向你收费,你将在类别 市场 和 服务名称SaaS 下看到一些条目,这些条目用于记录每个已使用模型的输入和输出。
重要
Azure 直接销售的模型(包括 Azure OpenAI)与来自合作伙伴和社区的模型之间的这种区别只会影响模型可供你使用的方式以及计费方式。 在所有情况下,模型都托管在 Azure 云中,并且与外部服务或提供商没有交互。
微调的模型
Azure OpenAI 微调模型的收费是根据 训练文件中令牌的数量计算的。 有关最新价格,请参阅 官方定价页。
部署微调模型后,你还需要根据以下情况付费:
- 托管小时数。
- 每千个令牌的推理(根据输入使用情况和输出使用情况划分)。
托管时长成本是需要注意的重要因素,因为在微调模型部署后,即使你并未主动使用它,它仍会持续产生每小时的费用。 密切监视已部署微调模型的成本。
重要
部署自定义模型后,如果部署随时保持非活动状态超过 15 天,则会删除部署。 如果模型是在超过 15 天前部署的且在连续 15 天内无补全或聊天补全调用,则自定义模型的部署处于“非活动”状态。
删除非活动状态的部署时,不会删除或影响基础自定义模型,并且可以随时重新部署自定义模型。
部署的每个自定义(微调)模型都会产生每小时的托管成本,无论是否对模型进行补全或聊天补全调用都是如此。
HTTP 错误响应代码和计费状态
如果服务执行处理,即使状态代码不成功(不是 200),也可能需要支付费用。 例如,由于内容筛选器或输入限制而导致的 400 错误,或者由于超时而出现 408 错误。
如果服务不进行处理,则不需要支付费用。 例如,由于身份验证而导致的 401 错误或因超出速率限制而出现 429 错误。
监控成本
使用 Azure AI Foundry 时,会产生费用。 Azure 资源使用单位成本因时间间隔(秒、分钟、小时和天)或单位使用情况(字节、MB 等)而异。 可以在成本分析中查看产生的成本。
使用成本分析时,可以在图表和表中查看不同时间间隔的成本。 有些示例是按天、当前、上个月和年划分的。 还可以对比预算和预测的成本来查看成本。 切换到随时间推移的较长视图有助于确定支出趋势,以便查看可能出现超支的位置。 如果已创建预算,还可以轻松查看超支的地方。
监视 Azure AI Foundry 成本
可以从 Azure 门户访问成本分析。
重要
Azure AI Foundry 成本只是整个应用程序或解决方案成本的子集。 需要监视应用程序或解决方案中使用的所有 Azure 资源的成本。
下面是如何监视项目成本的示例。 成本仅用作示例。 成本因使用的服务和使用量而异。
登录到 Azure AI Foundry。
选择项目,然后从左侧菜单中选择 管理中心 。
在 “资源 ”标题下,选择“ 概述”。
在 “资源属性”下,选择资源组链接。 Azure 门户会打开你的 Foundry 资源的资源组。
选择成本分析。
你将看到成本概述。 还可以添加筛选器(如部署级别标记),以查看基于模型部署的成本,如以下屏幕截图所示。
选择“按资源>列出的成本”以打开“成本分析”页。
可以查看您的 Foundry 资源的成本,并查看该资源下多个模型部署间的成本分配。
按计量器分析成本明细
若要了解成本明细,请使用 Azure 门户中 的成本分析工具 。 按照以下步骤了解推理成本:
在屏幕右上角,选择 Azure AI Foundry 资源的名称,或者如果要处理 AI 项目,请选择项目的名称。
选择项目的名称。 Azure 门户会在新窗口中打开。
在“成本管理”下,选择“成本分析”。
默认情况下,成本分析的范围限定为所选资源组。
重要
将 成本分析 范围限定为部署了 Azure AI Foundry 资源的资源组。 与合作伙伴和社区提供的模型关联的费用计量器显示在资源组下,而非显示在 Azure AI Foundry 资源下。
将“分组依据”修改为“计量”。 现在可以看到,对于此特定资源组,成本的来源来自不同的模型系列。
由 Azure 直接销售的模型
由 Azure 直接销售的模型(包括 Azure OpenAI)将直接收费。 它们显示为每个 Azure AI Foundry 资源下的计费指示器。 Microsoft直接处理此计费。 检查账单时,您会看到用于计算每个已用模型输入和输出的计费计量器。
来自合作伙伴和社区的模型
第三方提供商提供的模型(如 Cohere)使用 Azure 市场计费。 与 Microsoft 计费计量不同,这些条目关联的是部署 Azure AI Foundry 的资源组,而不是 Azure AI Foundry 资源本身。 由于模型供应商直接向你收费,你将在类别 市场 和 服务名称SaaS 下看到一些条目,这些条目用于记录每个已使用模型的输入和输出。
重要
Azure 直接销售的模型(包括 Azure OpenAI)与来自合作伙伴和社区的模型之间的这种区别只会影响模型可供你使用的方式以及计费方式。 在所有情况下,模型都托管在 Azure 云中,并且与外部服务或提供商没有交互。
按资源监视成本
可以通过按资源对成本进行分组来获取更详细的计费信息:
在成本分析中,选择“按资源>成本”。
现在,可以看到生成每个计费计量的资源。 若要了解构成该成本的明细,可以将“分组依据”修改为“计量”,将图表类型切换为“折线图”。
Azure OpenAI 模型和 Microsoft 模型作为计量表显示在每个 Azure AI 服务资源下。
某些提供商的模型显示为全局资源下的计量。 "Global" 一词与模型部署的 SKU 无关(例如,“Global standard”)。 如果有多个 Azure AI 服务资源,则帐单会为每个 Azure AI 服务资源的每个模型都包含一个条目。 资源计量的格式为 [model-name]-[GUID],其中 [GUID] 是与给定 Azure AI 服务资源关联的唯一标识符。 你注意到计费表记录了你使用的每个模型的输入和输出。
评估与 Azure AI 服务相关的成本时,必须了解范围。 如果资源是同一资源组的一部分,则可以在该级别确定成本分析的范围,以了解对成本的影响。 如果资源分布在多个资源组中,则可以将范围限定为订阅级别。
在更高层次的范围内,常常需要添加更多筛选器,以便更好地关注 Azure OpenAI 的使用情况。 当范围限定在订阅级别时,你会看到在 Azure OpenAI 成本管理上下文中可能不在意的许多其他资源。 当范围限定在订阅级别时,请导航到“成本管理”服务下的完整“成本分析工具”。
下面是如何使用 成本分析工具 查看订阅或资源组累计成本的示例:
- 在 Azure 搜索栏中搜索 成本管理 以导航到完整的服务体验,其中包括更多选项,例如创建预算。
- 如有必要,如果“范围:”未指向要分析的资源组或订阅,请选择“更改”。
- 在左侧,选择 “报告 + 分析>成本分析”。
- 在“ 所有视图 ”选项卡上,选择 “累计成本”。
成本分析仪表板显示根据为“范围”指定的内容分析的累计成本。
如果尝试按服务添加筛选器,则无法在列表中找到 Azure OpenAI。 出现这种情况的原因是,Azure OpenAI 具有 Azure AI 服务的子集的通用性,其中服务级别筛选器是 认知服务。 如果想要在订阅中查看所有 Azure OpenAI 资源,而无需任何其他类型的 Azure AI 服务资源,请改为限定为 服务层级:Azure OpenAI:
在 Azure 市场中监控模型的成本
Azure 市场提供无服务器 API 部署。 模型发布者可能会根据产品/服务应用不同的成本。 Azure AI Foundry 门户中的每个项目都有其自己的套餐订阅,可用于监视该项目上发生的成本和消耗。 使用 Microsoft 成本管理来监视成本:
登录到 Azure 门户。
选择门户菜单图标以打开左窗格。
在左窗格中,选择 “成本管理 + 计费 ”,然后选择“ 成本管理”。
在左窗格中,在 “报表 + 分析”部分下,选择 “成本分析”。
选择一个视图,例如“资源”。 随即会显示与每个资源关联的成本。
在“类型”列中,选择筛选器图标以筛选 microsoft.saas/resources类型的所有资源。 此类型对应于从 Azure 市场中可用的产品/服务创建的资源。 为方便起见,可以按包含字符串“SaaS”的资源类型进行筛选。
每个项目的每个模型产品/服务都会显示一个资源。 这些资源的命名为 [模型套餐名称]-[GUID]。
选择展开资源详细信息,以访问与资源关联的每个成本计量。
- “层级”表示产品/服务。
- “产品”是产品/服务中的具体产品。
某些模型提供商可能对两者使用相同的名称。
小窍门
请记住,每个项目根据其订阅的每个计划创建一个资源。
展开详细信息时,按照与产品/服务关联的每个计量报告成本。 每个计量可能跟踪不同的成本来源,例如推理或微调。 将显示以下计量值(当它们与某些成本相关时):
计量 分组 说明 paygo-inference-input-tokens 基本模型 与作为基础模型推理输入的代币相关的成本。 paygo-inference-output-tokens 基本模型 与作为基本模型推理输出生成的代币相关的成本。 paygo-微调模型推理托管 微调模型 与托管微调模型的推理终结点关联的成本。 此值不是托管模型的成本,而是让终结点为其提供服务的成本。 paygo-finetuned-model-inference-input-tokens 微调模型 与用作微调模型推理输入的令牌关联的成本。 paygo-finetuned-model-inference-output-tokens 微调模型 与作为微调模型的推理输出而生成的令牌关联的成本。
创建预算
使用自动警报防止成本溢出。创建用于 跟踪支出限制并 设置警报 的预算,以在成本接近或超出阈值时通知你。
最佳做法: 为 Azure 订阅和资源组创建预算和警报,作为总体成本监视策略的一部分。
如果需要在监视中更精细,请使用 Azure 中特定资源或服务的筛选器创建预算。 筛选器有助于确保不会意外地创建花费更多资金的新资源。 有关创建预算时筛选选项的详细信息,请参阅 “组”和“筛选”选项。
重要
虽然 OpenAI 有一个硬性限制选项,可阻止超出预算,但 Azure OpenAI 目前不提供此功能。 你可以从操作组开始自动化,作为预算通知的一部分,以采取更高级的操作,但此功能需要额外的定制开发。
导出成本数据
可以将 成本数据导出 到存储帐户。 当你或其他人员需要执行额外的数据分析以降低成本时,导出数据会很有帮助。 例如,财务团队可以使用 Excel 或 Power BI 分析数据。 可以按每天、每周或每月计划导出成本,并设置自定义的日期范围。 建议导出成本数据来检索成本数据集。
可能累算的其他成本
启用将数据发送到 Azure Monitor 日志和警报等功能会为这些服务带来额外的成本。 这些成本在其他服务下和订阅级别可见,但如果范围仅限于 Azure AI 服务资源,则不可见。
使用 Azure 预付款
可以使用 Azure 预付款(之前称为货币承诺)额度支付由 Azure 直接销售的模型费用。 但是,无法使用 Azure 预付款额度支付其他提供商模型的费用,因为它们是通过 Azure 市场计费的。
有关详细信息,请参阅 Azure 定价计算器。
相关内容
- Azure AI Foundry 管理中心
- Azure AI Foundry 状态仪表板
- 了解如何通过成本管理优化云投资。
- 详细了解如何通过成本分析来管理成本。
- 了解如何防止意外成本。
- 参与成本管理引导式学习课程。