你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI Foundry 模型的部署概述

Azure AI Foundry 中的模型目录是用于发现和使用各种 Foundry 模型来生成生成 AI 应用程序的中心。 你需要部署模型,使其可用于接收推理请求。 Azure AI Foundry 根据需求和模型要求,为 Foundry 模型提供了一套全面的部署选项。

部署选项

Azure AI Foundry 提供多个部署选项,具体取决于预配的模型和资源类型。 以下部署选项可用:

  • Azure AI Foundry 资源中的标准部署
  • 部署到无服务器 API 端点
  • 部署到托管计算

Azure AI Foundry 门户可能会根据环境和配置自动选择部署选项。 尽可能使用 Azure AI Foundry 资源进行部署。 支持多种部署选项的模型会默认使用 Azure AI Foundry 资源进行部署。 若要访问其他部署选项,请使用 Azure CLI 或 Azure 机器学习 SDK 进行部署。

Azure AI Foundry 资源中的标准部署

Azure AI Foundry 资源(以前称为 Azure AI 服务资源)是 Azure AI Foundry 中 的首选部署选项 。 它提供范围最广泛的功能,包括区域、数据区域或全局处理,并提供标准和 预配的吞吐量(PTU) 选项。 Azure AI Foundry 模型中的旗舰模型支持此部署选项。

此部署选项在以下方面可用:

  • Azure AI Foundry 资源
  • Azure OpenAI 资源1
  • Azure AI 中心(连接到 Azure AI Foundry 资源时)

1如果使用 Azure OpenAI 资源,则模型目录仅在 Foundry 模型中显示用于部署的 Azure OpenAI。 可以通过升级到 Azure AI Foundry 资源来获取 Foundry 模型的完整列表。

若要开始使用 Azure AI Foundry 资源中的标准部署,请参阅 作说明:将模型部署到 Azure AI Foundry 模型

无服务器 API 终结点

此部署选项 仅在Azure AI 中心资源中可用。 它允许创建专用终结点来托管模型,可通过 API 进行访问。 Azure AI Foundry 模型支持无服务器 API 终结点的即用即付计费,并且只能为无服务器 API 终结点创建区域性部署。

若要开始部署到无服务器 API 终结点,请参阅将模型部署为无服务器 API 部署

托管计算

此部署选项 仅在Azure AI 中心资源中可用。 它允许创建专用终结点,以在 专用计算中托管模型。 你需要在订阅中拥有计算配额来托管模型,系统会按计算正常运行时间计费。

模型集合需要计算资源托管部署,其中包括:

  • Hugging Face
  • NVIDIA 推理微服务 (NIM)
  • 行业模型(Saifr、Rockwell、Bayer、Cerence、Sight Machine、Page AI、SDAIA)
  • Databricks
  • 自定义模型

若要开始,请参阅 如何部署和推断托管计算部署 ,以及 使用即用即付计费将 Azure AI Foundry 模型部署到托管计算

部署选项的功能

尽可能 在 Azure AI Foundry 资源中使用标准部署 。 此部署选项提供可用部署选项中的大多数功能。 下表列出了有关每个部署选项的特定功能的详细信息:

能力 Azure AI Foundry 资源中的标准部署 无服务器 API 终结点 托管计算
可以部署哪些模型? Foundry 模型 采用即用即付计费的 Foundry 模型 开放和自定义模型
部署资源 Azure AI Foundry 资源 AI 项目(在 AI 中心资源中) AI 项目(在 AI 中心资源中)
需要 AI 中心 是的 是的
数据处理选项 区域
数据区域
全球
区域 区域
专用网络 是的 是的 是的
内容筛选 是的 是的
自定义内容筛选 是的
无密钥身份验证 是的
计费依据 令牌使用情况和 预配的吞吐量单位 令牌用法2 计算核心小时3

2 最小终结点基础结构按分钟计费。 你无需为托管无服务器部署模型的基础结构付费。 删除终结点后,不会继续产生费用。

3 计费按分钟计费,具体取决于自创建以来部署中使用的产品层和实例数。 删除终结点后,不会继续产生费用。