你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文列出了 Azure 直接销售的 Azure AI Foundry 模型及其功能、部署类型和可用性区域,不包括已弃用和旧版模型。 由 Azure 直接销售的模型包括所有 Azure OpenAI 模型和来自顶级提供商的特定所选模型。
根据你在 Azure AI Foundry 中使用的项目类型,可以看到不同的模型选择。 具体而言,如果使用基于 Azure AI Foundry 资源构建的 Foundry 项目,则会看到适用于标准部署到 Foundry 资源的模型。 或者,如果使用由 Azure AI Foundry 中心托管的基于中心的项目,则会看到适用于部署到托管计算和无服务器 API 的模型。 这些模型选择通常重叠,因为许多模型支持多个部署选项。
若要详细了解由 Azure 直接销售的 Foundry 模型的属性,请参阅探索 Azure AI Foundry 模型。
注释
由 Azure 直接销售的 Foundry 模型还包括以下顶级模型提供商中的选择模型:
- 黑林实验室:
FLUX.1-Kontext-pro,FLUX-1.1-pro - DeepSeek:
DeepSeek-V3.1、DeepSeek-V3-0324、DeepSeek-R1-0528、DeepSeek-R1 - Meta:
Llama-4-Maverick-17B-128E-Instruct-FP8、Llama-3.3-70B-Instruct - Microsoft:
MAI-DS-R1 - Mistral:
mistral-document-ai-2505 - xAI:
grok-code-fast-1、、grok-3、grok-3-minigrok-4-fast-reasoning、grok-4-fast-non-reasoning、、grok-4
若要了解这些模型,请切换到本文顶部 的其他模型集合 。
Azure AI Foundry 中的 Azure OpenAI 模型
Azure OpenAI 由一组具有不同功能和价格点的不同模型提供支持。 模型可用性因区域和云而异。 有关 Azure 政府模型的可用性,请参阅 Azure 政府中的 Azure OpenAI。
| Models | Description |
|---|---|
| Sora | 新 索拉-2 |
| GPT-5 系列 | 新增 gpt-5、gpt-5-mini、gpt-5-nano、gpt-5-chat |
| gpt-oss | 新的开放权重推理模型 |
| codex-mini | 微调版本的 o4-mini。 |
| GPT-4.1 系列 | gpt-4.1、gpt-4.1-mini、gpt-4.1-nano |
| model-router | 从一组基础聊天模型中智能选择以响应给定提示的模型。 |
| computer-use-preview | 一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。 |
| o 系列模型 | 具有高级问题解决能力、增强的专注力和功能的推理模型。 |
| GPT-4o、GPT-4o mini 和 GPT-4 Turbo | 具有多模式版本的功能强大的 Azure OpenAI 模型,可以接受文本和图像作为输入。 |
| GPT-4 | 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
| GPT-3.5 | 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。 |
| Embeddings | 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。 |
| 图像生成 | 一系列可从自然语言生成原始图像的模型。 |
Video generation |
可从文本指令生成原始视频场景的模型。 |
| 音频 | 语音转文本、翻译和文本转语音的一系列模型。 GPT-4o 音频模型支持低延迟 语音输入、语音输出 对话交互或音频生成。 |
GPT-5
区域可用性
| 型号 | 区域 |
|---|---|
gpt-5 (2025-08-07) |
请参阅模型表。 |
gpt-5-mini (2025-08-07) |
请参阅模型表。 |
gpt-5-nano (2025-08-07) |
请参阅模型表。 |
gpt-5-chat (2025-08-07) |
请参阅模型表。 |
gpt-5-chat (2025-10-03) |
美国东部 2 (全球标准) 和瑞典中部 (全球标准) |
gpt-5-codex (2025-09-11) |
美国东部 2 (全球标准) 和瑞典中部 (全球标准) |
gpt-5-pro (2025-10-06) |
美国东部 2 (全球标准) 和瑞典中部 (全球标准) |
gpt-5-mini、gpt-5-nano和gpt-5-chat不需要注册。
将根据 Microsoft 的资格条件授予访问权限。 之前申请并获得 o3 访问权限的客户无需重新应用,因为其已批准的订阅将在模型发布时自动获得访问权限。
| 模型 ID | Description | 上下文窗口 | 最大输出标记 | 训练数据(上限) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 - 功能的完整摘要。 |
400,000 输入:272,000 输出:128,000 |
128,000 | 2024 年 9 月 30 日 |
gpt-5-mini (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 - 功能的完整摘要。 |
400,000 输入:272,000 输出:128,000 |
128,000 | 2024 年 5 月 31 日 |
gpt-5-nano (2025-08-07) |
-
推理 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 - 功能的完整摘要。 |
400,000 输入:272,000 输出:128,000 |
128,000 | 2024 年 5 月 31 日 |
gpt-5-chat (2025-08-07)预览 |
- 聊天补全 API。 - 响应 API。 - 输入:文本/图像 - 输出:仅文本 |
128,000 | 16,384 | 2024 年 9 月 30 日 |
gpt-5-chat (2025-10-03)预览1 |
- 聊天补全 API。 - 响应 API。 - 输入:文本/图像 - 输出:仅文本 |
128,000 | 16,384 | 2024 年 9 月 30 日 |
gpt-5-codex (2025-09-11) |
-
Responses API 专用。 - 输入:文本/图像 - 输出:仅文本 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 - 功能的完整摘要 - 针对 Codex CLI 和 Codex VS Code 扩展进行优化 |
400,000 输入:272,000 输出:128,000 |
128,000 | - |
gpt-5-pro (2025-10-06) |
-
推理 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具 - 功能的完整摘要。 |
400,000 输入:272,000 输出:128,000 |
128,000 | 2024 年 9 月 30 日 |
注释
1gpt-5-chat 版 2025-10-03 引入了以情感智能和心理健康能力为重点的显著增强。 此升级集成了专用数据集和优化响应策略,以提高模型的能力:
- 更准确地理解和解释情感上下文,从而实现更细腻和富有同理心的互动。
- 在与心理健康相关的对话中提供支持、负责任的响应,确保敏感度和遵守最佳做法。
这些改进旨在使 GPT-5 聊天在情感语气和福祉考虑至关重要的情境中更具情境感知、以人为中心且更可靠。
gpt-oss
区域可用性
| 型号 | 区域 |
|---|---|
gpt-oss-120b |
所有 Azure OpenAI 区域 |
Capabilities
| 模型 ID | Description | 上下文窗口 | 最大输出标记 | 训练数据(上限) |
|---|---|---|---|---|
gpt-oss-120b(预览版) |
- 仅限文本输入/文本输出 - 聊天补全 API - 流式处理 - 函数调用 - 结构化输出 -推理 - 可用于部署1且通过托管计算使用 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
gpt-oss-20b(预览版) |
- 仅限文本输入/文本输出 - 聊天补全 API - 流式处理 - 函数调用 - 结构化输出 -推理 - 通过托管计算和Foundry Local提供 |
131,072 | 131,072 | 2024 年 5 月 31 日 |
1 与其他 Azure OpenAI 模型不同,gpt-oss-120b 需要 Azure AI Foundry 项目来部署模型。
使用代码进行部署
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
GPT-4.1 系列
区域可用性
| 型号 | 区域 |
|---|---|
gpt-4.1 (2025-04-14) |
请参阅模型表。 |
gpt-4.1-nano (2025-04-14) |
请参阅模型表。 |
gpt-4.1-mini (2025-04-14) |
请参阅模型表。 |
Capabilities
重要
已知问题会影响所有 GPT 4.1 系列模型。 超过 30 万个令牌的大型工具或函数调用定义将导致失败,即使未达到模型的 100 万个令牌上下文限制。
这些错误可能因 API 调用和基础有效负载特征而异。
下面是聊天补全 API 的错误消息:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
下面是响应 API 的错误消息:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| 模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-nano (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
gpt-4.1-mini (2025-04-14) |
- 文本和图像输入 - 文本输出 - 聊天补全 API - 响应 API - 流式处理 - 函数调用 - 结构化输出(聊天补全) |
- 1,047,576 - 128,000(预配的托管部署) - 300,000 (批量部署) |
32,768 | 2024 年 5 月 31 日 |
model-router
从一组基础聊天模型中智能选择以响应给定提示的模型。
区域可用性
| 型号 | 区域 |
|---|---|
model-router (2025-08-07) |
美国东部 2 (全球标准与数据区域标准), 瑞典中部 (全球标准与数据区域标准) |
model-router (2025-05-19) |
美国东部 2 (全球标准与数据区域标准), 瑞典中部 (全球标准与数据区域标准) |
数据区域标准模型路由器部署的计费将从 2025 年 11 月 1 日开始。
Capabilities
| 模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
|---|---|---|---|---|
model-router (2025-08-07) |
从一组基础模型中智能选择以响应给定提示的模型。 | 200,000 | 32,768 (GPT-4.1 series) 100,000 () o4-mini 128,000 () gpt-5 reasoning models16,384 ( gpt-5-chat) |
- |
model-router (2025-05-19) |
从一组基础聊天模型中智能选择以响应给定提示的模型。 | 200,000 | 32,768 (GPT-4.1 series) 100,000 () o4-mini |
2024 年 5 月 31 日 |
较大的上下文窗口与一些基础模型兼容。 这意味着,只有当提示恰好被路由到正确的模型时,具有较大上下文的 API 调用才会成功。 否则,调用会失败。
computer-use-preview
一个经过训练的实验模型,可与响应 API 计算机使用工具一起使用。
它可与第三方库一起使用,使模型能够控制鼠标和键盘输入,同时从当前环境的屏幕截图获取上下文。
注意
我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
需要注册才能访问 computer-use-preview。 将根据 Microsoft 的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。
若要请求访问权限,请转到 computer-use-preview 受限访问模型应用程序。 授予访问权限后,需要为模型创建部署。
区域可用性
| 型号 | 区域 |
|---|---|
computer-use-preview |
请参阅模型表。 |
Capabilities
| 模型 ID | Description | 上下文窗口 | 最大输出令牌数 | 训练数据(上限) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
专门为 Responses API 计算机使用工具设计的模型 -工具 - 流媒体 - 文本(输入/输出) - 图像(输入) |
8,192 | 1,024 | 2023 年 10 月 |
o 系列模型
Azure OpenAI o 系列模型设计用于处理推理和问题解决任务,具有更好的针对性和功能。 这些模型将更多时间花费在处理和理解用户的请求上,与以前的更迭版本相比,它们在科学、编码和数学等领域表现得异常强大。
| 模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
|---|---|---|---|
codex-mini (2025-05-16) |
微调版本的 o4-mini。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3-pro (2025-06-10) |
-
响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o4-mini (2025-04-16) |
-
新的推理模型,提供增强的推理能力。 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3 (2025-04-16) |
-
新的推理模型,提供增强的推理能力。 - 聊天补全 API。 - 响应 API。 - 结构化输出。 - 文本和图像处理。 - 函数、工具和并行工具调用。 功能的完整摘要。 |
输入:200,000 输出:100000 |
2024 年 5 月 31 日 |
o3-mini (2025-01-31) |
-
增强推理能力。 - 结构化输出。 - 仅文本处理。 - 函数和工具。 |
输入:200,000 输出:100000 |
2023 年 10 月 |
o1 (2024-12-17) |
-
增强推理能力。 - 结构化输出。 - 文本和图像处理。 - 函数和工具。 |
输入:200,000 输出:100000 |
2023 年 10 月 |
o1-preview (2024-09-12) |
较旧的预览版。 | 输入:128,000 输出:32,768 |
2023 年 10 月 |
o1-mini (2024-09-12) |
o1 系列中速度更快、更具成本效益的选项,非常适合需要速度和更低资源消耗的编码任务。 - 全球标准部署默认可用。 - 标准(区域)部署目前仅适用于在 o1-preview 受限访问版本中接收访问权限的选择客户。 |
输入:128,000 输出:65,536 |
2023 年 10 月 |
若要详细了解高级 o 系列模型,请参阅推理模型入门。
区域可用性
| 型号 | 区域 |
|---|---|
codex-mini |
美国东部 2 和瑞典中部(全球标准)。 |
o3-pro |
美国东部 2 和瑞典中部(全球标准)。 |
o4-mini |
请参阅模型表。 |
o3 |
请参阅模型表。 |
o3-mini |
请参阅模型表。 |
o1 |
请参阅模型表。 |
o1-preview |
请参阅模型表。 此模型仅适用于在原始受限访问中被授予访问权限的客户。 |
o1-mini |
请参阅模型表。 |
GPT-4o 和 GPT-4 Turbo
GPT-4o 在单个模型中集成文本和图像,从而能够同时处理多个数据类型。 这种多模式方法提高了人机交互的准确性和响应能力。 GPT-4o 在英语文本和编码任务方面与 GPT-4 Turbo 相当,但在非英语语言任务和视觉任务方面具有更优越的性能,为 AI 功能设定了新的基准。
如何访问 GPT-4o 和 GPT-4o mini 模型?
GPT-4o 和 GPT-4o mini 适用于标准和全球标准模型部署。
需要在该模型可用的受支持标准或全球标准区域中创建或使用现有资源。
创建资源后,可以部署 GPT-4o 模型。 如果你要执行编程部署,则模型名称如下:
-
gpt-4o版本2024-11-20 -
gpt-4o版本2024-08-06 -
gpt-4o版本2024-05-13 -
gpt-4o-mini版本2024-07-18
GPT-4 Turbo
GPT-4 Turbo 是一个大型多模态模型(接受文本或图像输入并生成文本),它可以比 OpenAI 的任何以前的模型更准确地解决难题。 与 GPT-3.5 Turbo 和较旧的 GPT-4 模型一样,GPT-4 Turbo 针对聊天进行了优化,能够很好地完成传统的补全任务。
GPT-4
GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 模型和 GPT-4 Turbo 模型的基础模型名称均为 gpt-4。 可以通过检查模型版本来区分 GPT-4 模型和 Turbo 模型。
GPT-4 模型和 GPT-4 Turbo 模型
这些模型只能与聊天补全 API 一起使用。
请参阅模型版本,了解 Azure OpenAI 如何处理模型版本升级。 请参阅使用模型,了解如何查看和配置 GPT-4 部署的模型版本设置。
| 模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
|---|---|---|---|
gpt-4o (2024-11-20)GPT-4o (Omni) |
- 结构化输出。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 - 增强的创意写作能力。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o (2024-08-06)GPT-4o (Omni) |
- 结构化输出。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o-mini (2024-07-18)GPT-4o mini |
- 速度快、价格低廉、功能强大的模型,是替代 GPT-3.5 Turbo 系列型号的理想选择。 - 文本和图像处理。 - JSON 模式。 - 并行函数调用。 |
输入:128,000 输出:16,384 |
2023 年 10 月 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
- 文本和图像处理。 - JSON 模式。 - 并行函数调用。 - 提高准确性和响应能力。 - 在英语文本和编码任务方面与支持视觉的 GPT-4 Turbo 相当。 - 在非英语语言和视觉任务方面具有更优越的性能。 |
输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4 (turbo-2024-04-09) 具有视觉的 GPT-4 Turbo |
新的正式版模型。 - 替代了所有以前的 GPT-4 预览版模型( vision-preview、1106-Preview、0125-Preview)。 - 功能可用性目前因输入的方法和部署类型而异。 |
输入:128,000 输出:4,096 |
2023 年 12 月 |
注意
建议不要在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
GPT-3.5
GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,还能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可以与聊天完成 API 一起使用。 使用使用补全 API 而不是聊天补全 API 时,GPT-3.5 Turbo 指令具有与 text-davinci-003 类似的功能。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是使用旧版 GPT-3.5 和 GPT-3 模型。
| 模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
|---|---|---|---|
gpt-35-turbo (0125) 新 |
- JSON 模式。 - 并行函数调用。 - 可重现的输出(预览版)。 - 当它以请求的格式进行响应时,准确度更高。 - 提供针对导致非英语函数调用的文本编码问题的 bug 的修补程序。 |
输入:16,385 输出:4,096 |
2021 年 9 月 |
gpt-35-turbo (1106) |
较旧的正式版模型。 - JSON 模式。 - 并行函数调用。 - 可重现的输出(预览版)。 |
输入:16,385 输出:4,096 |
2021 年 9 月 |
gpt-35-turbo-instruct (0914) |
仅限补全终结点。 - 替换旧补全模型。 |
4,097 | 2021 年 9 月 |
若要详细了解如何与 GPT-3.5 Turbo 和聊天补全 API 进行交互,请查看我们的操作方法详解文章。
嵌入
text-embedding-3-large 是最新且能力最强的嵌入模型。 不能在嵌入模型之间升级。 若要从使用 text-embedding-ada-002 移到 text-embedding-3-large,需要生成新的嵌入。
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
OpenAI 报告称,测试表明,在 MIRACL 基准测试下,大型和小型第三代嵌入模型在多语言检索平均性能方面表现更优。 在 MTEB 基准测试中,它们仍在英语任务上保持着良好性能。
| 评估基准 | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| MIRACL 平均值 | 31.4 | 44.0 | 54.9 |
| MTEB 平均值 | 61.0 | 62.3 | 64.6 |
第三代嵌入模型支持通过新的 dimensions 参数减小嵌入的大小。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 当你能够调整维度数时,就能更好地控制整体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions 参数。 若要使用此参数,建议升级到最新版本:pip install openai --upgrade。
OpenAI 的 MTEB 基准测试发现,即使第三代模型的维度减少到低于 text-embeddings-ada-002 的 1,536 维,其性能仍略胜一筹。
图像生成模型
图像生成模型从用户提供的文本提示生成图像。 GPT-image-1 系列模型处于限量访问预览阶段。 DALL-E 3 可通过 REST API 供公众使用。 配备客户端 SDK 的 DALL-E 2 和 DALL-E 3 处于预览状态。
需要注册才能访问 gpt-image-1 或 gpt-image-1-mini。 将根据 Microsoft 的资格条件授予访问权限。 有权访问其他受限访问模型的客户仍需要请求对此模型的访问权限。
若要请求访问权限,请转到 gpt-image-1 受限访问模型应用程序。 授予访问权限后,需要为模型创建部署。
区域可用性
| 型号 | 区域 |
|---|---|
dall-e-3 |
美国东部 Australia East 瑞典中部 |
gpt-image-1 |
美国西部 3(全球标准) 美国东部 2 (全球标准) 阿联酋北部 (全球标准) 波兰中部(全球标准) |
gpt-image-1-mini |
EastUS (全球标准) NorthCentralUS (全球标准) |
视频生成模型
Sora 是 OpenAI 的 AI 模型,可以从文本说明创建真实而富有想象力的视频场景。 Sora 目前为预览版。
区域可用性
| 型号 | 区域 |
|---|---|
sora |
美国东部 2 (全球标准) 瑞典中部(全球标准) |
sora-2 |
美国东部 2 (全球标准) 瑞典中部(全球标准) |
音频模型
Azure OpenAI 中的音频模型通过 realtime、completions 和 audio API 提供。
GPT-4o 音频模型
GPT 4o 音频模型是 GPT-4o 模型系列的一部分,支持低延迟的“语音输入,语音输出”对话交互或音频生成。
注意
我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版本或最新的稳定正式版。 指定预览的模型不遵循标准的 Azure OpenAI 模型生命周期。
下表提供了有关请求令牌上限和训练数据的详细信息:
| 模型 ID | Description | 最大请求(标记) | 训练数据(上限) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17)GPT-4o 音频 |
用于音频和文本生成的音频模型。 | 输入:128,000 输出:16,384 |
2023年9月 |
gpt-4o-audio-preview (2024-12-17)GPT-4o 音频 |
用于音频和文本生成的音频模型。 | 输入:128,000 输出:16,384 |
2023年9月 |
gpt-4o-realtime-preview (2025-06-03) GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4o-realtime-preview (2024-12-17)GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-4o-mini-realtime-preview (2024-12-17)GPT-4o 音频 |
用于实时音频处理的音频模型。 | 输入:128,000 输出:4,096 |
2023 年 10 月 |
gpt-realtime (2025-08-28)(正式版)gpt-realtime-mini (2025-10-06)gpt-audio(2025年08月28日)gpt-audio-mini(2025年10月06日) |
用于实时音频处理的音频模型。 | 输入:28,672 输出:4,096 |
2023 年 10 月 |
若要比较所有区域中 GPT-4o 音频模型的可用性,请参阅模型表。
音频 API
通过 API 的 /audio 音频模型可用于语音转文本、翻译和文本转语音。
语音转文本模型
| 模型 ID | Description | 最大请求(音频文件大小) |
|---|---|---|
whisper |
常规用途语音识别模型。 | 25 MB |
gpt-4o-transcribe |
由 GPT-4o 提供支持的语音转文本模型。 | 25 MB |
gpt-4o-mini-transcribe |
由 GPT-4o mini 提供支持的语音转文本模型。 | 25 MB |
gpt-4o-transcribe-diarize |
具有自动语音识别的语音转文本模型。 | 25 MB |
语音翻译模型
| 模型 ID | Description | 最大请求(音频文件大小) |
|---|---|---|
whisper |
常规用途语音识别模型。 | 25 MB |
文本转语音模型(预览版)
| 模型 ID | Description |
|---|---|
tts |
针对速度进行了优化的文本转语音模型。 |
tts-hd |
针对质量进行了优化的文本转语音模型。 |
gpt-4o-mini-tts |
由 GPT-4o mini 提供支持的文本转语音模型。 你可使语音以一种特定风格或语调说话。 |
有关详细信息,请参阅本文后面的音频模型区域可用性。
模型摘要表和区域可用性
按部署类型划分的模型
Azure OpenAI 为客户提供了适合其业务和使用模式的托管结构选择。 该服务提供两种主要部署类型:
- 标准:具有全球部署选项,可在全球范围内路由流量以提供更高的吞吐量。
- 已预配:还有一个全球部署选项,允许客户在 Azure 全球基础结构中购买和部署预配的吞吐量单位。
所有部署都可以执行完全相同的推理操作,但计费、规模和性能却大不相同。 要详细了解 Azure OpenAI 部署,请参阅我们的部署类型指南。
全球标准模型可用性
| Region | gpt-5,2025-08-07 | gpt-5-mini,2025-08-07 | gpt-5-nano,2025-08-07 | gpt-5-chat, 2025-08-07 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | sora, 2025-05-02 | model-router, 2025-08-07 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-image-1-mini, 2025-10-06 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | 计算机使用预览,2025-03-11 | o3-mini, 2025-01-31 | o1,2024年12月17日 | o1-mini,2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o,2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini,2024-07-18 | gpt-4,turbo-2024-04-09 | text-embedding-3-small,1 | text-embedding-3-large,1 | text-embedding-ada-002,2 | gpt-4o-realtime-preview,2024-12-17 | gpt-4o-realtime-preview, 2025-06-03 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview,2024-12-17 | gpt-4o-mini-audio-preview,2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 | gpt-5-codex, 2025-09-15 | gpt-audio, 2025-08-28 | gpt-realtime, 2025-08-28 | o3-deep-research, 2025-06-26 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| brazilsouth | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| 加拿大东部 | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| eastus | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | |
| francecentral | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| germanywestcentral | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| italynorth | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| japaneast | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| koreacentral | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| northcentralus | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| 挪威东部 | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | |
| polandcentral | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| southafricanorth | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| southcentralus | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| southindia | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| spaincentral | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | |
| switzerlandnorth | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| uaenorth | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| uksouth | ✅ | ✅ | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| westeurope | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | |
| westus | - | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | |
| westus3 | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - |
注释
o3-deep-research 目前仅适用于 Azure AI Foundry 代理服务。 若要了解详细信息,请参阅 深度研究工具指南。
此表未包括微调区域可用性信息。 有关此信息,请参阅微调部分。
按终结点的标准部署(区域)模型
聊天补全
| Region | o1-preview, 2024-09-12 | o1-mini,2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o,2024-08-06 | gpt-4o-mini,2024-07-18 | gpt-4,turbo-2024-04-09 | gpt-35-turbo,1106 | gpt-35-turbo, 0125 |
|---|---|---|---|---|---|---|---|---|---|
| australiaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| 加拿大东部 | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| francecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| 挪威东部 | - | - | - | ✅ | - | - | - | - | - |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| southindia | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandnorth | - | - | - | ✅ | - | - | - | - | ✅ |
| uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| westeurope | - | - | - | - | - | - | - | - | ✅ |
| westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
注释
o1-mini 目前可供所有客户用于全球标准部署。
在 o1-mini 有限访问版本中,选择客户被授予对 o1-preview 的标准(区域)部署访问权限。 目前,不会扩展对 o1-mini 标准(区域)部署的访问。
GPT-4 和 GPT-4 Turbo 模型可用性
GPT-3.5 模型
若要了解 Azure OpenAI 如何处理模型版本升级,请参阅模型版本。 若要了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置,请参阅使用模型。
微调模型
注释
gpt-35-turbo:此模型的微调仅限于一小部分区域,并且基础模型在可用的每个区域中都不可用。
如果在 Azure AI Foundry 项目内部(而不是在某个项目外部)使用 Azure OpenAI 模型,则支持进行微调的区域可能会有所不同。
| 模型 ID | 标准训练区域 | 全球培训 | 最大请求(标记) | 训练数据(上限) | Modality |
|---|---|---|---|---|---|
gpt-35-turbo (1106) |
美国东部 2 美国中北部 瑞典中部 瑞士西部 |
- | 输入:16,385 输出:4,096 |
2021 年 9 月 | 文本转文本 |
gpt-35-turbo (0125) |
美国东部 2 美国中北部 瑞典中部 瑞士西部 |
- | 16,385 | 2021 年 9 月 | 文本转文本 |
gpt-4o-mini (2024-07-18) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2023 年 10 月 | 文本转文本 |
gpt-4o (2024-08-06) |
美国东部 2 美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2023 年 10 月 | 文本和视觉转文本 |
gpt-4.1 (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本和视觉转文本 |
gpt-4.1-mini (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本转文本 |
gpt-4.1-nano (2025-04-14) |
美国中北部 瑞典中部 |
✅ | 输入:128,000 输出:16,384 训练示例上下文长度:32,768 |
2024 年 5 月 | 文本转文本 |
o4-mini (2025-04-16) |
美国东部 2 瑞典中部 |
- | 输入:128,000 输出:16,384 训练示例上下文长度:65,536 |
2024 年 5 月 | 文本转文本 |
注释
全球训练为每个令牌提供更实惠的训练,但不提供数据驻留。 它目前可用于以下区域中的 Azure OpenAI 资源:
- Australia East
- Brazil South
- 加拿大中部
- 加拿大东部
- 美国东部
- 美国东部 2
- 法国中部
- 德国中西部
- 意大利北部
- 日本东部 (无视力支持)
- 韩国中部
- 美国中北部
- 挪威东部
- 波兰中部 (无4.1纳米支持)
- 东南亚
- 南非北部
- 美国中南部
- 印度南部
- 西班牙中部
- 瑞典中部
- 瑞士西部
- 瑞士北部
- 英国南部
- 西欧
- 美国西部
- 美国西部 3
助手(预览版)
对于助手,你需要受支持模型和受支持区域的组合。 某些工具和功能需要最新的模型。 以下模型可在助手 API、SDK 和 Azure AI Foundry 中使用。 下表适用于标准部署。 若要了解预配吞吐量单位可用性,请参阅预配吞吐量。 列出的模型和区域可用于助手 v1 和 v2。 如果下列区域支持全球标准模型,则可以使用这些模型。
| 区域 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4,1106-Preview | gpt-4,0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo,0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k,0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| 挪威东部 | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| southindia | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
模型停用
有关模型停用的最新信息,请参阅模型停用指南。
相关内容
注释
由 Azure 直接销售的 Foundry 模型还包括所有 Azure OpenAI 模型。 若要了解这些模型,请切换到本文顶部的 Azure OpenAI 模型 集合。
黑森林实验室的模型由 Azure 直接销售
图像生成模型的黑林实验室 (BFL) 集合包括用于上下文生成和编辑的 FLUX.1 Kontext [pro],以及用于文本到图像生成的 FLUX1.1 [pro]。
可以通过 BFL 服务提供商 API 以及 图像/代系和图像/编辑终结点运行这些模型。
| 型号 | 类型和 API 终结点 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| FLUX.1-Kontext-pro |
图像生成 - 图像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations and https://<resource-name>/openai/deployments/{deployment-id}/images/edits - BFL 服务提供商 API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
输入:文本和图像(5,000 个标记和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式:图像(PNG 和 JPG) - 主要功能: 字符一致性,高级编辑 - 其他参数:(仅限供应商特定的 API) seed、aspect ratio、input_imageprompt_unsamplingsafety_toleranceoutput_formatwebhook_urlwebhook_secret |
- 全球标准(所有区域) | Foundry,基于中心的 |
| FLUX-1.1-pro |
图像生成 - 图像 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - BFL 服务提供商 API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
输入: 文本(5,000 个令牌和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) - 主要功能: 快速推断速度,强提示符合性,竞争性定价,可扩展生成 - 其他参数:(仅限供应商特定的 API) width、height、prompt_unsamplingseedsafety_toleranceoutput_formatwebhook_urlwebhook_secret |
- 全球标准(所有区域) | Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
DeepSeek 模型直接由 Azure 销售
DeepSeek 系列模型包括 DeepSeek-R1,它擅长使用分步训练过程推理任务,如语言、科学推理和编码任务。
| 型号 | 类型 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| DeepSeek-V3.1 | chat-completion (具有推理内容) |
-
输入:文本(131,072 个标记) - 输出: (131,072 个令牌) - 语言: en 和 zh - 工具调用: 是的 - 响应格式:文本、JSON |
- 全球标准(所有区域) | Foundry,基于中心的 |
| DeepSeek-R1-0528 | chat-completion (具有推理内容) |
-
输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
- 全球标准(所有区域) - 全局预配(所有区域) |
Foundry,基于中心的 |
| DeepSeek-V3-0324 | chat-completion |
-
输入:文本(131,072 个标记) - 输出: (131,072 个令牌) - 语言: en 和 zh - 工具调用: 是的 - 响应格式:文本、JSON |
- 全球标准(所有区域) - 全局预配(所有区域) |
Foundry,基于中心的 |
| DeepSeek-R1 | chat-completion (具有推理内容) |
-
输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
- 全球标准(所有区域) - 全局预配(所有区域) |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。
Azure 直售元模型
Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 Meta 模型规模大小不一,包括:
- 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
- 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
- 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
| 型号 | 类型 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| Llama-4-Maverick-17B-128E-Instruct-FP8 | chat-completion |
-
输入:文本和图像(1M 个标记) - 输出: 文本(1M 词元) - 语言: ar、、en、fr和 dehiiditptestlthvi - 工具调用:无 - 响应格式:文本 |
- 全球标准(所有区域) | Foundry,基于中心的 |
| Llama-3.3-70B-Instruct | chat-completion |
-
输入:文本(128,000 个标记) - 输出:文本(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用:无 - 响应格式:文本 |
- 全球标准(所有区域) | Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的此模型集合。 还可以从合作伙伴和社区找到多个 Meta 模型。
Azure 直售 Microsoft 模型
Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。 若要查看所有可用的Microsoft模型,请查看 Azure AI Foundry 门户中的Microsoft模型集合。
| 型号 | 类型 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| MAI-DS-R1 | chat-completion (具有推理内容) |
-
输入: 文本(163,840 个标记) - 输出:(163,840 个标记) - 语言: en 和 zh - 工具调用:无 - 响应格式:文本。 |
- 全球标准(所有区域) | Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的Microsoft模型集合。 还可以从合作伙伴和社区找到多个 Microsoft 模型。
由 Azure 直接销售的 Mistral 模型
| 型号 | 类型 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| mistral-document-ai-2505 | 图像到文本 |
-
输入:图像或 PDF 页面(30 页,最大 30MB PDF 文件) - 输出: 文本 - 语言:en - 工具调用: 否 - 响应格式: 文本、JSON、Markdown |
- 全球标准(所有区域) - 数据区域标准(美国和欧盟) |
铸造 |
请参阅 Azure AI Foundry 门户中的 Mistral 模型集合。 还可以从合作伙伴和社区找到多个 Mistral 模型。
xAI 模型直接由 Azure 销售
Azure AI Foundry 模型中 xAI 的 Grok 模型包括一组不同的模型,这些模型旨在以不同的功能和价格点在各种企业领域脱颖而出,其中包括:
Grok 3 是由 Colossus 数据中心预先训练的非推理模型,专为业务用例(如数据提取、编码和文本摘要)而定制,具有卓越的指令遵循能力。 它支持 131,072 令牌上下文窗口,允许它处理广泛的输入,同时保持一致性和深度,并且善于跨域和语言绘制连接。
Grok 3 Mini 是一种轻型推理模型,旨在通过测试时计算解决智能体、编码、数学和深度科学问题。 它还支持一个 131,072 个令牌的上下文窗口,用于理解代码库和企业文档,并擅长使用工具解决新环境中的复杂逻辑问题,为思维预算可调整的用户检查提供原始推理跟踪。
Grok Code Fast 1 是一种快速高效的推理模型,旨在用于智能体编码应用程序。 它使用了以编码为中心的数据混合进行预先训练,然后根据 xAI 的安全策略使用各种编码任务和工具用法的演示以及正确拒绝行为的演示进行了后期训练。 需要注册才能访问 grok-code-fast-1 模型。
Grok 4 Fast 是一种效率优化的语言模型,它提供接近 Grok 4 的推理功能,其延迟和成本明显降低,并且可以完全绕过超快应用程序的推理。 它经过了安全有效的工具使用培训,内置拒绝行为、固定安全强制系统提示和输入筛选器以防止滥用。
Grok 4 是 xAI 的最新推理模型,具有先进的推理和工具使用功能,使它能够在具有挑战性的学术和行业基准方面实现最先进的性能。 需要注册才能访问 grok-4 模型。
| 型号 | 类型 | Capabilities | 部署类型(区域可用性) | 项目类型 |
|---|---|---|---|---|
| grok-4 | chat-completion |
-
输入: 文本、图像(256,000 个标记) - 输出:文本(8,192 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) | Foundry,基于中心的 |
| grok-4-快速推理 | chat-completion |
-
输入: 文本,图像(2,000,000 个标记) - 输出: 文本(2,000,000 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) - 数据区域标准(美国) |
Foundry,基于中心的 |
| grok-4-fast-non-reasoning | chat-completion |
-
输入: 文本,图像(2,000,000 个标记) - 输出: 文本(2,000,000 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) - 数据区域标准(美国) |
Foundry,基于中心的 |
| grok-code-fast-1 | chat-completion |
-
输入:文本(256,000 个标记) - 输出:文本(8,192 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) | Foundry,基于中心的 |
| grok-3 | chat-completion |
-
输入:文本(131,072 个标记) - 输出: 文本(131,072 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) - 数据区域标准(美国) |
Foundry,基于中心的 |
| grok-3-mini | chat-completion |
-
输入:文本(131,072 个标记) - 输出: 文本(131,072 个标记) - 语言: en - 工具调用: 是 - 响应格式: 文本 |
- 全球标准(所有区域) - 数据区域标准(美国) |
Foundry,基于中心的 |
请参阅 Azure AI Foundry 门户中的 xAI 模型集合。
按部署类型为区域可用性建模
Foundry 模型提供适合业务和使用模式的托管结构选择。 该服务提供两种主要部署类型:
- 标准:具有全球部署选项,可在全球范围内路由流量以提供更高的吞吐量。
- 已预配:还有一个全局部署选项,允许你在 Azure 全球基础结构中购买和部署预配的吞吐量单位。
所有部署都执行相同的推理操作,但计费、扩展性和性能不同。 有关部署类型的详细信息,请参阅 Azure AI Foundry 模型中的部署类型。
全球标准模型可用性
| Region | DeepSeek-R1-0528 | DeepSeek-R1 | DeepSeek-V3-0324 | DeepSeek-V3.1 | FLUX.1-Kontext-pro | FLUX-1.1-pro | grok-4 | grok-4-快速推理 | grok-4-fast-non-reasoning | grok-code-fast-1 | grok-3 | grok-3-mini | Llama-4-Maverick-17B-128E-Instruct-FP8 | Llama-3.3-70B-Instruct | MAI-DS-R1 | mistral-document-ai-2505 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| brazilsouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 加拿大东部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| francecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| italynorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 挪威东部 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| polandcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southafricanorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southindia | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westeurope | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
打开和自定义模型
模型目录提供来自更广泛的提供商的丰富模型选择。 对于这些模型,不能将该选项用于 Azure AI Foundry 资源中的标准部署,其中模型以 API 的形式提供。 相反,若要部署这些模型,可能需要将其托管在基础结构上,创建 AI 中心,并提供基础计算配额来托管模型。
此外,这些模型可以开放访问或 IP 保护。 在这两种情况下,必须在 Azure AI Foundry 的托管计算产品/服务中部署它们。 若要开始,请参阅 操作指南:部署到托管计算。