Delen via


Foundry Models die rechtstreeks worden verkocht door Azure

In dit artikel wordt een selectie van Azure AI Foundry-modellen weergegeven die rechtstreeks door Azure worden verkocht, samen met hun mogelijkheden , implementatietypen en beschikbaarheidsregio's, met uitzondering van afgeschafte en verouderde modellen. Modellen die rechtstreeks door Azure worden verkocht, omvatten alle Azure OpenAI-modellen en specifieke, geselecteerde modellen van topproviders.

Afhankelijk van het type project dat u in Azure AI Foundry gebruikt, ziet u een andere selectie van modellen. Als u een Foundry-project gebruikt dat is gebouwd op een Azure AI Foundry-resource, ziet u de modellen die beschikbaar zijn voor standaardimplementatie naar een Foundry-resource. Als u ook een hubproject gebruikt dat wordt gehost door een Azure AI Foundry-hub, ziet u modellen die beschikbaar zijn voor implementatie voor beheerde compute- en serverloze API's. Deze modelselecties overlappen vaak omdat veel modellen ondersteuning bieden voor meerdere implementatieopties.

Zie Azure AI Foundry Models verkennen voor meer informatie over kenmerken van Foundry Models die rechtstreeks door Azure worden verkocht.

Opmerking

Foundry Models die rechtstreeks door Azure worden verkocht, bevatten ook geselecteerde modellen van de volgende topmodelproviders:

  • Black Forest Labs: FLUX.1-Kontext-pro, FLUX-1.1-pro
  • DeepSeek: DeepSeek-V3.1, DeepSeek-V3-0324, DeepSeek-R1-0528DeepSeek-R1
  • Meta: Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-3.3-70B-Instruct
  • Microsoft: MAI-DS-R1
  • Mistral: mistral-document-ai-2505
  • xAI: grok-code-fast-1, grok-3, grok-3-mini, grok-4-fast-reasoning, grok-4-fast-non-reasoning, grok-4

Als u meer wilt weten over deze modellen, gaat u naar Andere modelverzamelingen bovenaan dit artikel.

Azure OpenAI in Azure AI Foundry-modellen

Azure OpenAI wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio en cloud. Voor beschikbaarheid van Azure Government-modellen raadpleegt u Azure OpenAI in Azure Government.

Models Description
Sora NIEUWE sora-2
GPT-5 serie NIEUWE gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat
gpt-oss NIEUWE open-gewicht redeneringsmodellen
codex-mini Verfijnde versie van o4-mini.
GPT-4.1 serie gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
model-router Een model dat intelligent uit een set onderliggende chatmodellen selecteert om te reageren op een bepaalde prompt.
computer-use-preview Een experimenteel model dat is getraind voor gebruik met de computergebruikstool van de Responses API.
o-serie modellen Redeneringsmodellen met geavanceerde probleemoplossing en meer focus en mogelijkheden.
GPT-4o, GPT-4o mini en GPT-4 Turbo Geschikt voor Azure OpenAI-modellen met multimodale versies, die zowel tekst als afbeeldingen als invoer kunnen accepteren.
GPT-4 Een reeks modellen die verbeteringen zijn ten opzichte van GPT-3.5 en die natuurlijke taal en code kunnen begrijpen en genereren.
GPT-3.5 Een reeks modellen die een verbetering zijn ten opzichte van GPT-3 en die natuurlijke taal en code kunnen begrijpen en genereren.
Embeddings Een set modellen waarmee tekst kan worden omgezet in numerieke vectorvorm om de gelijkenis van tekst te vergemakkelijken.
Afbeeldingen genereren Een reeks modellen waarmee oorspronkelijke afbeeldingen uit natuurlijke taal kunnen worden gegenereerd.
Video generation Een model dat oorspronkelijke videoscènes kan genereren op basis van tekstinstructies.
Audio Een reeks modellen voor spraak naar tekst, vertaling en tekst naar spraak. GPT-4o-audiomodellen ondersteunen ofwel gespreksinteracties met lage latentie spraak-in en spraak-uit, of audiogeneratie.

GPT-5

Beschikbaarheid van de regio

Model Regio
gpt-5 (2025-08-07) Bekijk de modeltabellen.
gpt-5-mini (2025-08-07) Bekijk de modeltabellen.
gpt-5-nano (2025-08-07) Bekijk de modeltabellen.
gpt-5-chat (2025-08-07) Bekijk de modeltabellen.
gpt-5-chat (2025-10-03) VS - oost2 (Global Standard) en Zweden - centraal (Global Standard)
gpt-5-codex (2025-09-11) VS - oost2 (Global Standard) en Zweden - centraal (Global Standard)
gpt-5-pro (2025-10-06) VS - oost2 (Global Standard) en Zweden - centraal (Global Standard)

Toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft. Klanten die eerder toegang hebben toegepast en toegang o3hebben gekregen, hoeven niet opnieuw toe te passen omdat hun goedgekeurde abonnementen automatisch toegang krijgen bij de release van het model.

Model-ID Description Contextvenster Max aantal uitvoertokens Trainingsgegevens (tot en met)
gpt-5 (2025-08-07) - Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024
gpt-5-mini (2025-08-07) - Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 31 mei 2024
gpt-5-nano (2025-08-07) - Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 31 mei 2024
gpt-5-chat (2025-08-07)
Voorbeeld
- Api voor voltooiing van chat.
- Antwoord-API.
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
128,000 16,384 30 september 2024
gpt-5-chat (2025-10-03)
Voorbeeld1
- Api voor voltooiing van chat.
- Antwoord-API.
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
128,000 16,384 30 september 2024
gpt-5-codex (2025-09-11) - Alleen antwoord-API .
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 -
gpt-5-pro (2025-10-06) - Redenering
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024

Opmerking

1gpt-5-chat versie 2025-10-03 introduceert een aanzienlijke verbetering gericht op emotionele intelligentie en mentale gezondheid mogelijkheden. Deze upgrade integreert gespecialiseerde gegevenssets en verfijnde responsstrategieën om het vermogen van het model te verbeteren om:

  • Emotionele context nauwkeuriger begrijpen en interpreteren , waardoor genuanceerde en empathische interacties mogelijk zijn.
  • Bied ondersteunende, verantwoordelijke reacties in gesprekken met betrekking tot geestelijke gezondheid, waardoor gevoeligheid en naleving van best practices worden gewaarborgd.

Deze verbeteringen hebben tot doel GPT-5-chat meer contextbewust, mensgericht en betrouwbaar te maken in scenario's waarin emotionele toon- en welzijnsoverwegingen essentieel zijn.

gpt-oss

Beschikbaarheid van de regio

Model Regio
gpt-oss-120b Alle Azure OpenAI-regio's

Capabilities

Model-ID Description Contextvenster Max aantal uitvoertokens Trainingsgegevens (tot en met)
gpt-oss-120b (voorbeeld) - Alleen tekst in/uit tekst
- API voor voltooiing van chat
-Streaming
- Functie-aanroepen
- Gestructureerde uitvoer
-Redenering
- Beschikbaar voor implementatie1 en via beheerde rekenkracht
131,072 131,072 31 mei 2024
gpt-oss-20b (voorbeeld) - Alleen tekst in/uit tekst
- API voor voltooiing van chat
-Streaming
- Functie-aanroepen
- Gestructureerde uitvoer
-Redenering
- Beschikbaar via beheerde compute en Foundry Local
131,072 131,072 31 mei 2024

1 In tegenstelling tot andere Azure OpenAI-modellen gpt-oss-120b is een Azure AI Foundry-project vereist om het model te implementeren.

Implementeren met code

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

GPT-4.1 serie

Beschikbaarheid van de regio

Model Regio
gpt-4.1 (2025-04-14) Bekijk de modeltabellen.
gpt-4.1-nano (2025-04-14) Bekijk de modeltabellen.
gpt-4.1-mini (2025-04-14) Bekijk de modeltabellen.

Capabilities

Belangrijk

Een bekend probleem heeft invloed op alle GPT 4.1-seriemodellen. Grote hulpprogramma- of functie-aanroepdefinities die meer dan 300.000 tokens overschrijden, leiden tot fouten, ook al is de limiet van 1 miljoen tokencontexten van de modellen niet bereikt.

De fouten kunnen variëren op basis van API-aanroep en onderliggende nettoladingkenmerken.

Hier volgen de foutberichten voor de API voor chatvoltooiingen:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Dit is het foutbericht voor de Antwoorden-API:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
Model-ID Description Contextvenster Maximum aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-4.1 (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- Functie-aanroepen
- Gestructureerde uitvoer (chatvoltooiingen)
- 1,047,576
- 128.000 (ingerichte beheerde implementaties)
- 300.000 (batchimplementaties)
32,768 31 mei 2024
gpt-4.1-nano (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- Functie-aanroepen
- Gestructureerde uitvoer (chatvoltooiingen)
- 1,047,576
- 128.000 (ingerichte beheerde implementaties)
- 300.000 (batchimplementaties)
32,768 31 mei 2024
gpt-4.1-mini (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- Functie-aanroepen
- Gestructureerde uitvoer (chatvoltooiingen)
- 1,047,576
- 128.000 (ingerichte beheerde implementaties)
- 300.000 (batchimplementaties)
32,768 31 mei 2024

model-router

Een model dat intelligent uit een set onderliggende chatmodellen selecteert om te reageren op een bepaalde prompt.

Beschikbaarheid van de regio

Model Regio
model-router (2025-08-07) VS - oost 2 (Global Standard & Data Zone Standard), Zweden - centraal (Global Standard & Data Zone Standard)
model-router (2025-05-19) VS - oost 2 (Global Standard & Data Zone Standard), Zweden - centraal (Global Standard & Data Zone Standard)

Facturering voor routerimplementaties van het Standaardmodel voor gegevenszones begint niet eerder dan 1 november 2025.

Capabilities

Model-ID Description Contextvenster Maximum aantal uitvoertokens Trainingsgegevens (maximaal)
model-router (2025-08-07) Een model dat intelligent uit een set onderliggende modellen selecteert om te reageren op een bepaalde prompt. 200,000 32.768 (GPT-4.1 series)
100.000 (o4-mini)
128.000 (gpt-5 reasoning models)
16.384 (gpt-5-chat)
-
model-router (2025-05-19) Een model dat intelligent uit een set onderliggende chatmodellen selecteert om te reageren op een bepaalde prompt. 200,000 32.768 (GPT-4.1 series)
100.000 (o4-mini)
31 mei 2024

Grotere contextvensters zijn compatibel met een aantal onderliggende modellen. Dat betekent dat een API-aanroep met een grotere context alleen slaagt als de prompt naar het juiste model wordt doorgestuurd. Anders mislukt de aanroep.

computer-use-preview

Een experimenteel model dat is getraind voor gebruik met de Responses API, een hulpprogramma voor computergebruik.

Het kan worden gebruikt met bibliotheken van derden om het model toe te staan om muis- en toetsenbordinvoer te beheren, terwijl context wordt opgehaald uit schermopnamen van de huidige omgeving.

Waarschuwing

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van het Azure OpenAI-model.

Registratie is vereist voor toegang computer-use-preview. Toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft. Klanten die toegang hebben tot andere modellen met beperkte toegang, moeten nog steeds toegang aanvragen voor dit model.

Als u toegang wilt aanvragen, gaat u naar computer-use-preview de toepassing voor een beperkt toegangsmodel. Wanneer toegang wordt verleend, moet u een implementatie voor het model maken.

Beschikbaarheid van de regio

Model Regio
computer-use-preview Bekijk de modeltabellen.

Capabilities

Model-ID Description Contextvenster Maximum aantal uitvoertokens Trainingsgegevens (maximaal)
computer-use-preview (2025-03-11) Gespecialiseerd model voor gebruik met het Responses API-hulpprogramma voor computergebruik.

-Gereedschap
-Streaming
- Tekst (invoer/uitvoer)
- Afbeelding (invoer)
8,192 1,024 Oktober 2023

o-serie modellen

De o-serie Azure OpenAI-modellen zijn ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden. Deze modellen besteden meer tijd aan het verwerken en begrijpen van de aanvraag van de gebruiker, waardoor ze uitzonderlijk sterk zijn op gebieden zoals wetenschap, codering en wiskunde, vergeleken met eerdere iteraties.

Model-ID Description Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
codex-mini (2025-05-16) Verfijnde versie van o4-mini.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3-pro (2025-06-10) - Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o4-mini (2025-04-16) - Nieuw redeneringsmodel, met verbeterde redeneringsmogelijkheden.
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3 (2025-04-16) - Nieuw redeneringsmodel, met verbeterde redeneringsmogelijkheden.
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3-mini (2025-01-31) - Verbeterde redeneringsmogelijkheden.
- Gestructureerde uitvoer.
- Alleen tekstverwerking.
- Functies en hulpprogramma's.
Invoer: 200.000
Uitvoer: 100.000
Oktober 2023
o1 (2024-12-17) - Verbeterde redeneringsmogelijkheden.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Invoer: 200.000
Uitvoer: 100.000
Oktober 2023
o1-preview (2024-09-12) Oudere preview-versie. Invoer: 128.000
Uitvoer: 32.768
Oktober 2023
o1-mini (2024-09-12) Een snellere en rendabelere optie in de o1-serie, ideaal voor het coderen van taken waarvoor snelheid en lager resourceverbruik nodig zijn.
- Wereldwijde standaardimplementatie is standaard beschikbaar.
- Standaardimplementaties (regionaal) zijn momenteel alleen beschikbaar voor bepaalde klanten die toegang hebben ontvangen als onderdeel van de o1-preview versie met beperkte toegang.
Invoer: 128.000
Uitvoer: 65,536
Oktober 2023

Zie Aan de slag met redeneringsmodellen voor meer informatie over geavanceerde o-seriemodellen.

Beschikbaarheid van de regio

Model Regio
codex-mini VS - oost 2 & Zweden - centraal (Global Standard).
o3-pro VS - oost 2 & Zweden - centraal (Global Standard).
o4-mini Bekijk de modeltabellen.
o3 Bekijk de modeltabellen.
o3-mini Bekijk de modeltabellen.
o1 Bekijk de modeltabellen.
o1-preview Bekijk de modeltabellen. Dit model is alleen beschikbaar voor klanten die toegang hebben gekregen als onderdeel van de oorspronkelijke beperkte toegang.
o1-mini Bekijk de modeltabellen.

GPT-4o en GPT-4 Turbo

GPT-4o integreert tekst en afbeeldingen in één model, waardoor het meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers. GPT-4o komt overeen met GPT-4 Turbo in het Engels tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse taaltaken en visietaken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.

Hoe krijg ik toegang tot de GPT-4o en GPT-4o minimodellen?

GPT-4o en GPT-4o mini zijn beschikbaar voor de implementatie van het Standard- en Global Standard-model.

U moet een bestaande resource maken of gebruiken in een ondersteunde Standard - of Global Standard-regio waar het model beschikbaar is.

Wanneer uw resource is gemaakt, kunt u de GPT-4o-modellen implementeren . Als u een programmatische implementatie uitvoert, zijn de modelnamen:

  • gpt-4o Versie2024-11-20
  • gpt-4o Versie2024-08-06
  • gpt-4o Versie2024-05-13
  • gpt-4o-mini Versie2024-07-18

GPT-4 Turbo

GPT-4 Turbo is een groot multimodale model (accepteren van tekst- of afbeeldingsinvoer en het genereren van tekst) die moeilijke problemen met een grotere nauwkeurigheid kan oplossen dan een van de vorige modellen van OpenAI. Net als GPT-3.5 Turbo en oudere GPT-4-modellen is GPT-4 Turbo geoptimaliseerd voor chatten en werkt het goed voor traditionele voltooiingstaken.

GPT-4

GPT-4 is de voorganger van GPT-4 Turbo. Zowel de GPT-4- als GPT-4 Turbo-modellen hebben een basismodelnaam van gpt-4. U kunt onderscheid maken tussen de GPT-4- en Turbo-modellen door de modelversie te bekijken.

GPT-4- en GPT-4 Turbo-modellen

Deze modellen kunnen alleen worden gebruikt met de API voor chatvoltooiingen.

Zie Modelversies voor meer informatie over hoe Azure OpenAI modelversieupgrades verwerkt. Zie Werken met modellen voor meer informatie over het weergeven en configureren van de modelversie-instellingen van uw GPT-4-implementaties.

Model-ID Description Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in niet-Engelse talen en bij visuele verwerkingsopdrachten.
- Verbeterde creatieve schrijfvaardigheid.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in niet-Engelse talen en bij visuele verwerkingsopdrachten.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
- Snel, goedkoop, geschikt model ideaal voor het vervangen van GPT-3.5 Turbo-modellen.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in niet-Engelse talen en bij visuele verwerkingsopdrachten.
Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo met Vision
Nieuw algemeen beschikbaar model.
- Vervanging voor alle vorige GPT-4 preview-modellen (vision-preview, 1106-Preview, 0125-Preview).
- De beschikbaarheid van functies verschilt momenteel, afhankelijk van de invoermethode en het implementatietype.
Invoer: 128.000
Uitvoer: 4.096
December 2023

Waarschuwing

We raden u niet aan om preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van het Azure OpenAI-model.

GPT-3.5

GPT-3.5-modellen kunnen natuurlijke taal of code begrijpen en genereren. Het meest geschikte en rendabele model in de GPT-3.5-familie is GPT-3.5 Turbo, die is geoptimaliseerd voor chat en ook goed werkt voor traditionele voltooiingstaken. GPT-3.5 Turbo is beschikbaar voor gebruik met de API voor chatvoltooiingen. GPT-3.5 Turbo Instruct heeft vergelijkbare mogelijkheden als text-davinci-003 wanneer u de Voltooiings-API gebruikt in plaats van de API voor chatvoltooiingen. We raden u aan GPT-3.5 Turbo en GPT-3.5 Turbo Instruct te gebruiken voor oudere GPT-3.5- en GPT-3-modellen.

Model-ID Description Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
gpt-35-turbo (0125) nieuw - JSON-modus.
- Parallelle functie aanroepen.
- Reproduceerbare uitvoer (preview).
- Hogere nauwkeurigheid wanneer deze reageert in aangevraagde indelingen.
- Bevat een oplossing voor een fout die een tekstcoderingsprobleem heeft veroorzaakt voor niet-Engelse functie-aanroepen.
Invoer: 16.385
Uitvoer: 4.096
Sep 2021
gpt-35-turbo (1106) Ouder model dat algemeen beschikbaar is.
- JSON-modus.
- Parallelle functie aanroepen.
- Reproduceerbare uitvoer (preview).
Invoer: 16.385
Uitvoer: 4.096
Sep 2021
gpt-35-turbo-instruct (0914) Voltooiingseindpunt alleen.
- Vervanging voor verouderde voltooiingsmodellen.
4,097 Sep 2021

Raadpleeg ons uitgebreide artikel voor meer informatie over hoe u kunt communiceren met GPT-3.5 Turbo en de API voor chatvoltooiingen.

Embedderingen

text-embedding-3-large is het meest recente en meest geschikte insluitmodel. U kunt geen upgrade uitvoeren tussen insluitingsmodellen. Als u wilt overstappen van gebruik text-embedding-ada-002 naar text-embedding-3-large, moet u nieuwe insluitingen genereren.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

OpenAI-rapporten die laten zien dat zowel de grote als de kleine derde generatie insluitingsmodellen betere gemiddelde prestaties van het ophalen van meerdere talen bieden met de MIRACL-benchmark . Ze onderhouden nog steeds prestaties voor Engelse taken met de MTEB-benchmark .

Evaluatiebenchmark text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-gemiddelde 31.4 44.0 54.9
MTEB-gemiddelde 61.0 62.3 64.6

De insluitingsmodellen van de derde generatie ondersteunen het verminderen van de grootte van het insluiten via een nieuwe dimensions parameter. Meestal zijn grotere insluitingen duurder vanuit het perspectief van rekenkracht, geheugen en opslag. Wanneer u het aantal dimensies kunt aanpassen, krijgt u meer controle over de totale kosten en prestaties. De dimensions parameter wordt niet ondersteund in alle versies van de OpenAI 1.x Python-bibliotheek. Als u wilt profiteren van deze parameter, raden we u aan om een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade.

De MTEB-benchmarktests van OpenAI hebben vastgesteld dat zelfs wanneer de afmetingen van het derde generatiemodel worden verlaagd tot minder dan de 1536 dimensies van text-embeddings-ada-002, de prestaties iets beter blijven.

Modellen voor het genereren van afbeeldingen

De modellen voor het genereren van afbeeldingen genereren afbeeldingen op basis van tekstprompts die de gebruiker biedt. GPT-image-1-seriemodellen zijn in beperkte previewtoegang. DALL-E 3 is algemeen beschikbaar voor gebruik met de REST API's. DALL-E 2 en DALL-E 3 met client-SDK's zijn in preview.

Registratie is vereist voor toegang tot gpt-image-1 of gpt-image-1-mini. Toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft. Klanten die toegang hebben tot andere modellen met beperkte toegang, moeten nog steeds toegang aanvragen voor dit model.

Als u toegang wilt aanvragen, gaat u naar gpt-image-1 de toepassing voor een beperkt toegangsmodel. Wanneer toegang wordt verleend, moet u een implementatie voor het model maken.

Beschikbaarheid van de regio

Model Regio
dall-e-3 East US
Australia East
Zweden - centraal
gpt-image-1 West VS 3 (Global Standard)
Oost VS 2 (Global Standard)
UAE - noord (Global Standard)
Centraal Polen (Global Standard)
Zweden - centraal (Global Standard)
gpt-image-1-mini West VS 3 (Global Standard)
Oost VS 2 (Global Standard)
UAE - noord (Global Standard)
Centraal Polen (Global Standard)
Zweden - centraal (Global Standard)

Modellen voor het genereren van video's

Sora is een AI-model van OpenAI dat realistische en fantasierijke videoscènes kan maken op basis van tekstinstructies. Sora is in de previewfase.

Beschikbaarheid van de regio

Model Regio
sora VS - oost 2 (Global Standard)
Zweden - centraal (Global Standard)
sora-2 VS - oost 2 (Global Standard)
Zweden - centraal (Global Standard)

Audiomodellen

Audiomodellen in Azure OpenAI zijn beschikbaar via de realtime, completionsen audio API's.

GPT-4o-audiomodellen

De GPT-4o-audiomodellen maken deel uit van de GPT-4o-modelfamilie en ondersteunen ofwel lage latentie, spraak in, gespreksinteracties of audiogeneratie.

Waarschuwing

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van het Azure OpenAI-model.

Details over maximum aantal aanvraagtokens en trainingsgegevens zijn beschikbaar in de volgende tabel:

Model-ID Description Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o audio
Audiomodel voor het genereren van audio en tekst. Invoer: 128.000
Uitvoer: 16.384
September 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o audio
Audiomodel voor het genereren van audio en tekst. Invoer: 128.000
Uitvoer: 16.384
September 2023
gpt-4o-realtime-preview (2025-06-03)
GPT-4o audio
Audiomodel voor realtime audioverwerking. Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o audio
Audiomodel voor realtime audioverwerking. Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Audiomodel voor realtime audioverwerking. Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-audio(28-08-2025)
gpt-audio-mini(2025-10-06)
Audiomodel voor realtime audioverwerking. Invoer: 28.672
Uitvoer: 4.096
Oktober 2023

Als u de beschikbaarheid van GPT-4o-audiomodellen in alle regio's wilt vergelijken, raadpleegt u de tabel modellen.

Audio-API

De audiomodellen via de /audio API kunnen worden gebruikt voor spraak naar tekst, vertaling en tekst naar spraak.

Spraak-naar-tekstmodellen

Model-ID Description Maximale aanvraag (bestandsgrootte van audio)
whisper Spraakherkenningsmodel voor algemeen gebruik. 25 MB
gpt-4o-transcribe Spraak-naar-tekstmodel mogelijk gemaakt door GPT-4o. 25 MB
gpt-4o-mini-transcribe Spraak-naar-tekstmodel mogelijk gemaakt door GPT-4o mini. 25 MB
gpt-4o-transcribe-diarize Spraak-naar-tekstmodel met automatische spraakherkenning. 25 MB

Spraakomzettingsmodellen

Model-ID Description Maximale aanvraag (bestandsgrootte van audio)
whisper Spraakherkenningsmodel voor algemeen gebruik. 25 MB

Tekst-naar-spraak-modellen (preview)

Model-ID Description
tts Tekst-naar-spraak-model geoptimaliseerd voor snelheid.
tts-hd Tekst-naar-spraak-model geoptimaliseerd voor kwaliteit.
gpt-4o-mini-tts Tekst-naar-spraak model mogelijk gemaakt door GPT-4o mini.

U kunt de stem begeleiden om te spreken in een specifieke stijl of toon.

Zie de beschikbaarheid van audiomodellen verderop in dit artikel voor meer informatie.

Overzichtstabel van het model en beschikbaarheid per regio

Modellen op implementatietype

Azure OpenAI biedt klanten keuzes in de hostingstructuur die past bij hun bedrijfs- en gebruikspatronen. De service biedt twee hoofdtypen van implementatie:

  • Standaard: heeft een globale implementatieoptie, verkeer globaal routeren om een hogere doorvoer te bieden.
  • Ingericht: heeft ook een globale implementatieoptie, zodat klanten ingerichte doorvoereenheden kunnen aanschaffen en implementeren in de wereldwijde Infrastructuur van Azure.

Alle implementaties kunnen exact dezelfde deductiebewerkingen uitvoeren, maar de facturering, schaal en prestaties verschillen aanzienlijk. Zie onze handleiding voor implementatietypen van Azure OpenAI voor meer informatie over Azure OpenAI-implementatietypen.

Wereldwijde beschikbaarheid van standard-modellen

Region gpt-5, 2025-08-07 gpt-5-mini, 2025-08-07 gpt-5-nano, 2025-08-07 gpt-5-chat, 2025-08-07 o3-pro, 2025-06-10 codex-mini, 2025-05-16 sora, 2025-05-02 model-router, 2025-08-07 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-image-1-mini, 2025-10-06 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 voorbeeld-voor-computergebruik, 2025-03-11 o3-mini, 2025-01-31 o1, 2024-12-17 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 tekst insluiten-3-klein, 1 tekst-insluiten-3-groot, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-realtime-preview, 2025-06-03 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20 gpt-5-codex, 2025-09-15 gpt-audio, 2025-08-28 gpt-realtime, 2025-08-28 o3-deep-research, 2025-06-26
Australië Oost - - - - - - - - - - - - - - - - - - - - - - - -
Brazilië Zuid - - - - - - - - - - - - - - - - - - - - - - - - - -
Oost-Canada - - - - - - - - - - - - - - - - - - - - - - - - -
Eastus - - - - - - - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - - - - - - - - - - -
Centraalwest-Duitsland - - - - - - - - - - - - - - - - - - - - - - - - - -
Noord-Italië - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
JapanOost - - - - - - - - - - - - - - - - - - - - - - - -
Korea-Centraal - - - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - - - - - - - - - - -
NoorwegenOost - - - - - - - - - - - - - - - - - - - - - - - - -
Polencentral - - - - - - - - - - - - - - - - - - - - - - - - -
Zuid-Afrika Noord - - - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - - - - - - - - -
Zuid-India - - - - - - - - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
Zwitserland Noord - - - - - - - - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - - - - - - - - - - -
UKSouth - - - - - - - - - - - - - - - - - - - - - - - -
West-Europa - - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - - - - -

Opmerking

o3-deep-research is momenteel alleen beschikbaar met azure AI Foundry Agent Service. Meer weten? Zie de Deep Research-tool richtlijnen.

Deze tabel bevat geen gedetailleerde regionale beschikbaarheidsgegevens. Raadpleeg de fijnafstemmingssectie voor deze informatie.

Standaardimplementatiemodellen (regionaal) per eindpunt

Chatresultaten

Region o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
Australië Oost - - - - - -
Oost-Canada - - - - - -
Eastus -
eastus2 -
francecentral - - - - - -
JapanOost - - - - - - -
northcentralus -
NoorwegenOost - - - - - - - -
southcentralus -
Zuid-India - - - - - -
swedencentral
Zwitserland Noord - - - - - - -
UKSouth - - - - - -
West-Europa - - - - - - - -
westus
westus3 -

Opmerking

o1-mini is momenteel beschikbaar voor alle klanten voor de implementatie van Global Standard.

Bepaalde klanten hebben standaardtoegang voor regionale implementatie tot o1-mini gekregen als onderdeel van de o1-preview release met beperkte toegang. Op dit moment wordt de toegang tot o1-mini standaardimplementaties (regionale) implementaties niet uitgebreid.

Beschikbaarheid van GPT-4- en GPT-4 Turbo-modellen

GPT-3.5-modellen

Zie Modelversies voor meer informatie over hoe Azure OpenAI modelversie-upgrades verwerkt. Zie Werken met modellen voor meer informatie over het weergeven en configureren van de modelversie-instellingen van uw GPT-3.5 Turbo-implementaties.

Modellen verfijnen

Opmerking

gpt-35-turbo: Het afstemmen van dit model is beperkt tot een subset van regio's en is niet beschikbaar in elke regio waar het basismodel beschikbaar is.

De ondersteunde regio's voor het afstemmen kunnen variëren als u Azure OpenAI-modellen gebruikt in een Azure AI Foundry-project versus buiten een project.

Model-ID Standaardtrainingsregio's Wereldwijde training Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal) Modality
gpt-35-turbo
(1106)
Oost-VS 2
VS - noord-centraal
Zweden - centraal
Switzerland West
- Invoer: 16.385
Uitvoer: 4.096
Sep 2021 Tekst naar tekst
gpt-35-turbo
(0125)
Oost-VS 2
VS - noord-centraal
Zweden - centraal
Switzerland West
- 16,385 Sep 2021 Tekst naar tekst
gpt-4o-mini
(2024-07-18)
VS - noord-centraal
Zweden - centraal
Invoer: 128.000
Uitvoer: 16.384
Contextlengte van trainingsvoorbeeld: 65.536
Oktober 2023 Tekst naar tekst
gpt-4o
(2024-08-06)
Oost-VS 2
VS - noord-centraal
Zweden - centraal
Invoer: 128.000
Uitvoer: 16.384
Contextlengte van trainingsvoorbeeld: 65.536
Oktober 2023 Tekst en visie op tekst
gpt-4.1
(2025-04-14)
VS - noord-centraal
Zweden - centraal
Invoer: 128.000
Uitvoer: 16.384
Contextlengte van trainingsvoorbeeld: 65.536
Mei 2024 Tekst en visie op tekst
gpt-4.1-mini
(2025-04-14)
VS - noord-centraal
Zweden - centraal
Invoer: 128.000
Uitvoer: 16.384
Contextlengte van trainingsvoorbeeld: 65.536
Mei 2024 Tekst naar tekst
gpt-4.1-nano (2025-04-14) VS - noord-centraal
Zweden - centraal
Invoer: 128.000
Uitvoer: 16.384
Lengte van trainingsvoorbeeldcontext: 32.768
Mei 2024 Tekst naar tekst
o4-mini
(2025-04-16)
Oost-VS 2
Zweden - centraal
- Invoer: 128.000
Uitvoer: 16.384
Contextlengte van trainingsvoorbeeld: 65.536
Mei 2024 Tekst naar tekst

Opmerking

Wereldwijde training biedt meer betaalbare training per token, maar biedt geen dataresidency. Deze is momenteel beschikbaar voor Azure OpenAI-resources in de volgende regio's:

  • Australia East
  • Brazilië Zuid
  • Canada Central
  • Canada East
  • East US
  • Oostelijke VS2
  • Centraal Frankrijk
  • West-Centraal Duitsland
  • Italy North
  • Japan - oost (geen vision-ondersteuning)
  • Korea Central
  • Noord-Centraal VS
  • Norway East
  • Polen - centraal (geen 4.1-nano-ondersteuning)
  • Zuidoost-Azië
  • Zuid-Afrika - noord
  • Zuid-Centraal Verenigde Staten
  • South India
  • Spain Central
  • Zweden - centraal
  • Switzerland West
  • Switzerland North
  • UK South
  • West Europe
  • West US
  • West-US3

Assistenten (preview)

Voor assistenten hebt u een combinatie van een ondersteund model en een ondersteunde regio nodig. Voor bepaalde hulpprogramma's en mogelijkheden zijn de nieuwste modellen vereist. De volgende modellen zijn beschikbaar in de Assistent-API, SDK en Azure AI Foundry. De volgende tabel is bedoeld voor de standaardimplementatie. Zie Ingerichte doorvoer voor informatie over de beschikbaarheid van ingerichte doorvoereenheden. De vermelde modellen en regio's kunnen worden gebruikt met zowel Assistenten v1 als v2. U kunt Global Standard-modellen gebruiken als ze worden ondersteund in de volgende regio's.

Regio gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Australië Oost - - - - -
Eastus - - - -
eastus2 - - - -
francecentral - - - - - -
JapanOost - - - - - - - - -
NoorwegenOost - - - - - - - - - - -
Zuid-India - - - - - - - - -
swedencentral - -
UKSouth - - - - - -
westus - - - - -
westus3 - - - - - -

Buitengebruikstelling van model

Raadpleeg de handleiding voor buitengebruikstelling van modellen voor de meest recente informatie over buitengebruikstelling van modellen.

Opmerking

Foundry Models die rechtstreeks door Azure worden verkocht, bevatten ook alle Azure OpenAI-modellen. Als u meer wilt weten over deze modellen, gaat u naar de verzameling Azure OpenAI-modellen bovenaan dit artikel.

Black Forest Labs-modellen die rechtstreeks door Azure worden verkocht

De BFL-verzameling (Black Forest Labs) van modellen voor het genereren van afbeeldingen bevat FLUX.1 Kontext [pro] voor het genereren en bewerken van context en FLUX1.1 [pro] voor het genereren van tekst-naar-afbeelding.

U kunt deze modellen runnen via de API van de BFL-serviceprovider en via de afbeeldingen/generaties en afbeeldingen/bewerkingen-eindpunten.

Model Type & API-eindpunt Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
FLUX.1-Kontext-pro Afbeeldingen genereren
- Afbeeldings-API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
en
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Invoer: tekst en afbeelding (5.000 tokens en 1 afbeelding)
- Uitvoer: Eén afbeelding
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijke functies: Tekenconsistentie, geavanceerd bewerken
- Aanvullende parameters:(Alleen in provider-specifieke API)seed, aspect ratio, input_image, prompt_unsampling, safety_tolerance, output_format, webhook_url, webhook_secret
- Algemene standaard (alle regio's) Foundry, op basis van hub
FLUX-1.1-pro Afbeeldingen genereren
- Afbeeldings-API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Invoer: tekst (5.000 tokens en 1 afbeelding)
- Uitvoer: Eén afbeelding
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijke functies: Snelle deductiesnelheid, sterke naleving van prompts, concurrerende prijzen, schaalbare generatie
- Aanvullende parameters:(Alleen in provider-specifieke API)width, height, prompt_unsampling, seed, safety_tolerance, output_format, webhook_url, webhook_secret
- Algemene standaard (alle regio's) Foundry, op basis van hub

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

DeepSeek-modellen die rechtstreeks door Azure worden verkocht

De DeepSeek-serie met modellen bevat DeepSeek-R1, die uitblinkt in redeneringstaken met behulp van een stapsgewijs trainingsproces, zoals taal, wetenschappelijke redenering en coderingstaken.

Model Typologie Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
DeepSeek-V3.1 chat-completion
(met redeneringsinhoud)
- Invoer: tekst (131.072 tokens)
- Uitvoer: (131.072 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's) Foundry, op basis van hub
DeepSeek-R1-0528 chat-completion
(met redeneringsinhoud)
- Invoer: tekst (163.840 tokens)
- Uitvoer: (163.840 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Tekst.
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)
Foundry, op basis van hub
DeepSeek-V3-0324 chat-completion - Invoer: tekst (131.072 tokens)
- Uitvoer: (131.072 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)
Foundry, op basis van hub
DeepSeek-R1 chat-completion
(met redeneringsinhoud)
- Invoer: tekst (163.840 tokens)
- Uitvoer: (163.840 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Tekst.
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)
Foundry, op basis van hub

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Metamodellen die rechtstreeks door Azure worden verkocht

Meta Llama-modellen en -hulpprogramma's zijn een verzameling vooraf getrainde en verfijnde AI-tekst- en afbeeldingsredenmodellen. Metamodellen variëren in schaal om het volgende op te nemen:

  • Kleine taalmodellen (SLM's) zoals 1B en 3B Base en Instruct-modellen voor inferentie op het apparaat zelf en edge-computing
  • Middelgrote grote taalmodellen (LLM's) zoals 7B, 8B en 70B Base- en Instruct-modellen
  • Krachtige modellen zoals Meta Llama 3.1-405B Instruct for synthetic data generation and distilling use cases.
Model Typologie Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Invoer: tekst en afbeeldingen (1M-tokens)
- Uitvoer: tekst (1M-tokens)
- Talen:ar, en, fr, de, hi, id, it, pt, es, tl, en thvi
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's) Foundry, op basis van hub
Llama-3.3-70B-Instruct chat-completion - Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en, de, fr, it, pt, hi, en esth
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's) Foundry, op basis van hub

Bekijk deze modelverzameling in de Azure AI Foundry-portal. U kunt ook verschillende Meta-modellen vinden die beschikbaar zijn bij partners en community's.

Microsoft-modellen die rechtstreeks door Azure worden verkocht

Microsoft-modellen omvatten verschillende modelgroepen, zoals MAI-modellen, Phi-modellen, AI-modellen voor gezondheidszorg en meer. Als u alle beschikbare Microsoft-modellen wilt zien, bekijkt u de Microsoft-modelverzameling in de Azure AI Foundry-portal.

Model Typologie Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
MAI-DS-R1 chat-completion
(met redeneringsinhoud)
- Invoer: tekst (163.840 tokens)
- Uitvoer: (163.840 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Nee
- Antwoordindelingen: Tekst.
- Algemene standaard (alle regio's) Foundry, op basis van hub

Zie de Microsoft-modelverzameling in de Azure AI Foundry-portal. U kunt ook verschillende Microsoft-modellen vinden die beschikbaar zijn bij partners en community's.

Mistral modellen die rechtstreeks door Azure worden verkocht

Model Typologie Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
mistral-document-ai-2505 Afbeelding naar tekst - Invoer: afbeeldings- of PDF-pagina's (30 pagina's, maximaal 30 MB PDF-bestand)
- Uitvoer: tekst
- Talen: Engels
- Aanroepen van hulpprogramma's: nee
- Antwoordindelingen: Tekst, JSON, Markdown
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS en EU)
Gieterij

Zie de verzameling Mistral-modellen in de Azure AI Foundry-portal. U kunt ook verschillende Mistral-modellen vinden die beschikbaar zijn bij partners en community's.

xAI-modellen die rechtstreeks door Azure worden verkocht

De Grok-modellen van xAI in Azure AI Foundry-modellen bevatten een diverse set modellen die zijn ontworpen om te excelleren in verschillende bedrijfsdomeinen met verschillende mogelijkheden en prijspunten, waaronder:

  • Grok 3, een niet-redenerend model dat vooraf is getraind door het Kolossus-datacenter, is afgestemd op zakelijke gebruiksvoorbeelden zoals gegevensextractie, codering en samenvatting van tekst, met uitzonderlijke instructievolgmogelijkheden. Het biedt ondersteuning voor een contextvenster van 131.072 token, zodat het uitgebreide invoer kan verwerken terwijl de samenhang en diepte behouden blijft en verbindingen tussen domeinen en talen kan tekenen.

  • Grok 3 Mini is een lichtgewicht redeneringsmodel dat is getraind om agentische, coderings-, wiskundige en deep science-problemen met testtijd berekenen aan te pakken. Het biedt ook ondersteuning voor een contextvenster van 131.072 token voor inzicht in codebases en zakelijke documenten en excelt in het gebruik van hulpprogramma's om complexe logische problemen in nieuwe omgevingen op te lossen, met onbewerkte redeneringstraceringen voor gebruikersinspectie met aanpasbare denkbudgetten.

  • Grok Code Fast 1, een snel en efficiënt redeneringsmodel dat is ontworpen voor gebruik in agentische coderingstoepassingen. Het werd vooraf getraind op een op codering gericht gegevensmengsel, en vervolgens post-getraind op demonstraties van verschillende codetaken en het gebruik van hulpprogramma's, evenals demonstraties van correct weigeringsgedrag op basis van het veiligheidsbeleid van xAI. Registratie is vereist voor toegang tot het grok-code-fast-1-model.

  • Grok 4 Fast, een op efficiëntie geoptimaliseerd taalmodel dat near-Grok 4-redeneringsmogelijkheden biedt met aanzienlijk lagere latentie en kosten, en kan redenering volledig omzeilen voor ultrasnelle toepassingen. Het is getraind voor veilig en effectief gebruik van hulpprogramma's, met ingebouwd weigeringsgedrag, een vaste veiligheidsafdwinging systeemprompt en invoerfilters om misbruik te voorkomen.

  • Grok 4 is het nieuwste redeneringsmodel van xAI met geavanceerde redenerings- en toolgebruiksmogelijkheden, zodat het nieuwe geavanceerde prestaties kan bereiken in uitdagende academische en industriebenchmarks. Registratie is vereist voor toegang tot het grok-4-model.

Model Typologie Capabilities Implementatietype (beschikbaarheid van regio's) Project-type
grok-4 chat-completion - Invoer: tekst, afbeelding (256.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's) Foundry, op basis van hub
grok-4-fast-reasoning chat-completion - Invoer: tekst, afbeelding (2.000.000 tokens)
- Uitvoer: tekst (2.000.000 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS)
Foundry, op basis van hub
grok-4-fast-non-reasoning chat-completion - Invoer: tekst, afbeelding (2.000.000 tokens)
- Uitvoer: tekst (2.000.000 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS)
Foundry, op basis van hub
grok-code-fast-1 chat-completion - Invoer: tekst (256.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's) Foundry, op basis van hub
grok-3 chat-completion - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (131.072 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS)
Foundry, op basis van hub
grok-3-mini chat-completion - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (131.072 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS)
Foundry, op basis van hub

Zie de xAI-modelverzameling in de Azure AI Foundry-portal.

Beschikbaarheid van modelregio's per implementatietype

Foundry Models biedt u keuzes voor de hostingstructuur die past bij uw bedrijf en gebruikspatronen. De service biedt twee hoofdtypen van implementatie:

  • Standaard: heeft een globale implementatieoptie, verkeer globaal routeren om een hogere doorvoer te bieden.
  • Ingericht: heeft ook een globale implementatieoptie, waarmee u ingerichte doorvoereenheden kunt aanschaffen en implementeren in de wereldwijde Infrastructuur van Azure.

Alle implementaties voeren dezelfde deductiebewerkingen uit, maar de facturering, schaal en prestaties verschillen. Zie Implementatietypen in Azure AI Foundry-modellen voor meer informatie over implementatietypen.

Wereldwijde beschikbaarheid van standard-modellen

Region DeepSeek-R1-0528 DeepSeek-R1 DeepSeek-V3-0324 DeepSeek-V3.1 FLUX.1-Kontext-pro FLUX-1.1-pro grok-4 grok-4-fast-reasoning grok-4-fast-non-reasoning grok-code-fast-1 grok-3 grok-3-mini Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-DS-R1 mistral-document-ai-2505
Australië Oost
Brazilië Zuid
Oost-Canada
Eastus
eastus2
francecentral
Centraalwest-Duitsland
Noord-Italië
JapanOost
Korea-Centraal
northcentralus
NoorwegenOost
Polencentral
Zuid-Afrika Noord
southcentralus
Zuid-India
spaincentral
swedencentral
Zwitserland Noord
switzerlandwest
uaenorth
UKSouth
West-Europa
westus
westus3

Geopende en aangepaste modellen

De modelcatalogus biedt een grotere selectie modellen van een breder scala aan providers. Voor deze modellen kunt u de optie voor standaardimplementatie in Azure AI Foundry-resources niet gebruiken, waarbij modellen worden geleverd als API's. Als u deze modellen wilt implementeren, moet u deze mogelijk hosten in uw infrastructuur, een AI-hub maken en het onderliggende rekenquotum opgeven om de modellen te hosten.

Bovendien kunnen deze modellen open-access of IP-beschermd zijn. In beide gevallen moet u ze implementeren in beheerde rekenaanbiedingen in Azure AI Foundry. Zie Instructies: Implementeren naar beheerde rekenkracht om aan de slag te gaan.