你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

部署经过微调的模型进行推理

微调模型后,可以部署模型,并在自己的应用程序中使用它。

部署模型时,你将使模型可用于推理,这会产生每小时托管费用。 但是,经过微调的模型可以免费存储在 Azure AI Foundry 中,直到您准备好使用它们。

Azure OpenAI 为托管结构上的优化模型提供了部署类型的选择,这些模型适合不同的业务和使用模式: 标准全局标准 (预览版)和 预配吞吐量 (预览版)。 详细了解 优化模型的部署类型 以及 所有部署类型的概念

部署优化后的模型

若要部署自定义模型,请选择要部署的自定义模型,然后选择“ 部署”。

此时会打开“部署模型”对话框。 在该对话框中,输入部署名称,然后选择“创建”,开始部署自定义模型

屏幕截图显示了如何在 Azure AI Foundry 门户中部署自定义模型。

可在 Azure AI Foundry 门户的“部署”窗格中监视部署进度

UI 不支持跨区域部署,而 Python SDK 或 REST 支持。

Important

在部署自定义模型之后,如果部署处于非活动状态的时间超过十五 (15) 天,则会删除部署。 如果模型是在超过十五 (15) 天前部署的且在连续 15 天内无补全或聊天补全调用,则自定义模型的部署处于“非活动”状态

删除非活动状态的部署时,不会删除或影响基础自定义模型,并且可以随时重新部署自定义模型。 如 Azure AI Foundry 模型中的 Azure OpenAI 定价中所述,所部署的每个自定义(微调)模型都会产生每小时托管成本,而无论是否对模型进行补全或聊天补全调用。 若要详细了解如何使用 Azure OpenAI 规划和管理成本,请参阅 计划管理 Azure OpenAI 成本的指南。

使用部署的微调模型

部署自定义模型后,可像使用任何其他已部署的模型一样使用它。 可以使用 Azure AI Foundry 门户中Playgrounds 来试验新部署。 可以继续对自定义模型使用相同的参数,例如 temperaturemax_tokens,就像对其他已部署的模型一样。

Azure AI Foundry 门户中的“操场”窗格屏幕截图,其中突出显示了某些部分。

提示缓存

Azure OpenAI 微调对一组精选的模型支持提示缓存。 通过使用提示缓存,可以减少提示开头具有相同内容的较长提示的总体请求延迟和成本。 若要了解有关提示缓存的详细信息,请参阅提示缓存入门

部署类型

Azure OpenAI 微调支持以下部署类型。

标准

标准部署 提供按令牌付费计费模型,其数据驻留仅限于已部署区域。

Models 美国东部 2 美国中北部 瑞典中部 瑞士西部
o4-mini
GPT-4.1
GPT-4.1-mini
GPT-4.1-nano
GPT-4o
GPT-4o-mini
GPT-35-Turbo (1106)
GPT-35-Turbo (0125)

全局标准

全球标准 微调部署可 节省成本,但自定义模型权重可能会暂时存储在 Azure OpenAI 资源的地理位置之外。

所有 Azure OpenAI 区域均提供以下模型的全球标准部署:

  • o4-mini
  • GPT-4.1
  • GPT-4.1-mini
  • GPT-4.1-nano
  • GPT-4o
  • GPT-4o-mini

使用微调模型的“全球标准”部署用户体验的屏幕截图。

开发人员层

开发人员 优化部署提供与 全球标准 类似的体验,无需每小时托管费用,但不提供可用性服务级别协议(SLA)。 开发人员部署设计用于模型候选评估,而不是用于生产用途。

开发人员可以在所有 Azure OpenAI 区域部署这些模型:

  • GPT-4.1
  • GPT-4.1-mini
  • GPT-4.1-nano

预配吞吐量

Models 美国中北部 瑞典中部
GPT-4.1
GPT-4o
GPT-4o-mini

预配的吞吐量 微调部署为延迟敏感代理和应用程序提供 可预测的性能 。 它们使用与基本模型相同的区域预配吞吐量(PTU)容量,因此,如果已有区域 PTU 配额,则可以在支持区域中部署微调的模型。

清理部署

若要删除部署,请使用 部署 - 删除 REST API 并将 HTTP DELETE 发送到部署资源。 与创建部署一样,必须包含以下参数:

  • Azure 订阅 ID
  • Azure 资源组名称
  • Azure OpenAI 资源名称
  • 要删除的部署的名称

下面是用于删除部署的 REST API 示例:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2024-10-21" \
  -H "Authorization: Bearer <TOKEN>"

还可以在 Azure AI Foundry 门户中删除部署,或使用 Azure CLI

后续步骤