你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Azure AI Foundry 模型的部署概述

2025-09-22

Azure AI Foundry 中的模型目录是用于发现和使用各种 Foundry 模型来生成生成 AI 应用程序的中心。你需要部署模型，使其可用于接收推理请求。 Azure AI Foundry 根据需求和模型要求，为 Foundry 模型提供了一套全面的部署选项。

部署选项

Azure AI Foundry 提供多个部署选项，具体取决于预配的模型和资源类型。以下部署选项可用：

Azure AI Foundry 资源中的标准部署
部署到无服务器 API 端点
部署到托管计算

Azure AI Foundry 门户可能会根据环境和配置自动选择部署选项。尽可能使用 Azure AI Foundry 资源进行部署。支持多种部署选项的模型会默认使用 Azure AI Foundry 资源进行部署。若要访问其他部署选项，请使用 Azure CLI 或 Azure 机器学习 SDK 进行部署。

Azure AI Foundry 资源中的标准部署

Azure AI Foundry 资源（以前称为 Azure AI 服务资源）是 Azure AI Foundry 中 的首选部署选项 。它提供范围最广泛的功能，包括区域、数据区域或全局处理，并提供标准和预配的吞吐量（PTU）选项。 Azure AI Foundry 模型中的旗舰模型支持此部署选项。

此部署选项在以下方面可用：

Azure AI Foundry 资源
Azure OpenAI 资源¹
Azure AI 中心（连接到 Azure AI Foundry 资源时）

¹如果使用 Azure OpenAI 资源，则模型目录仅在 Foundry 模型中显示用于部署的 Azure OpenAI。可以通过升级到 Azure AI Foundry 资源来获取 Foundry 模型的完整列表。

若要开始使用 Azure AI Foundry 资源中的标准部署，请参阅作说明：将模型部署到 Azure AI Foundry 模型。

无服务器 API 终结点

此部署选项仅在Azure AI 中心资源中可用。它允许创建专用终结点来托管模型，可通过 API 进行访问。 Azure AI Foundry 模型支持无服务器 API 终结点的即用即付计费，并且只能为无服务器 API 终结点创建区域性部署。

若要开始部署到无服务器 API 终结点，请参阅将模型部署为无服务器 API 部署。

托管计算

此部署选项仅在Azure AI 中心资源中可用。它允许创建专用终结点，以在 专用计算中托管模型。你需要在订阅中拥有计算配额来托管模型，系统会按计算正常运行时间计费。

模型集合需要计算资源托管部署，其中包括：

Hugging Face
NVIDIA 推理微服务（NIM）
行业模型（Saifr、Rockwell、Bayer、Cerence、Sight Machine、Page AI、SDAIA）
Databricks
自定义模型

若要开始，请参阅如何部署和推断托管计算部署，以及使用即用即付计费将 Azure AI Foundry 模型部署到托管计算。

部署选项的功能

尽可能在 Azure AI Foundry 资源中使用标准部署。此部署选项提供可用部署选项中的大多数功能。下表列出了有关每个部署选项的特定功能的详细信息：

能力	Azure AI Foundry 资源中的标准部署	无服务器 API 终结点	托管计算
可以部署哪些模型？	Foundry 模型	采用即用即付计费的 Foundry 模型	开放和自定义模型
部署资源	Azure AI Foundry 资源	AI 项目（在 AI 中心资源中）	AI 项目（在 AI 中心资源中）
需要 AI 中心	否	是的	是的
数据处理选项	区域数据区域全球	区域	区域
专用网络	是的	是的	是的
内容筛选	是的	是的	否
自定义内容筛选	是的	否	否
无密钥身份验证	是的	否	否
计费依据	令牌使用情况和预配的吞吐量单位	令牌用法²	计算核心小时³

² 最小终结点基础结构按分钟计费。你无需为托管无服务器部署模型的基础结构付费。删除终结点后，不会继续产生费用。

³ 计费按分钟计费，具体取决于自创建以来部署中使用的产品层和实例数。删除终结点后，不会继续产生费用。

反馈

此页面是否有帮助？