Dela via


Distribuera en finjusterad modell för slutsatsdragning

När din modell har finjusterats kan du distribuera modellen och använda den i ditt eget program.

När du distribuerar modellen gör du modellen tillgänglig för slutsatsdragning och det medför en timvis värdavgift. Finjusterade modeller kan dock lagras i Azure AI Foundry utan kostnad tills du är redo att använda dem.

Azure OpenAI innehåller val av distributionstyper för finjusterade modeller i värdstrukturen som passar olika affärs- och användningsmönster: Standard, Global Standard (förhandsversion) och Etablerat dataflöde (förhandsversion). Läs mer om distributionstyper för finjusterade modeller och begreppen för alla distributionstyper.

Distribuera din finjusterade modell

Om du vill distribuera din anpassade modell väljer du den anpassade modell som ska distribueras och väljer sedan Distribuera.

Dialogrutan Distribuera modell öppnas. I dialogrutan anger du distributionsnamnet och väljer sedan Skapa för att starta distributionen av din anpassade modell.

Skärmbild som visar hur du distribuerar en anpassad modell i Azure AI Foundry-portalen.

Du kan övervaka förloppet för distributionen i fönstret Distributioner i Azure AI Foundry-portalen.

Användargränssnittet stöder inte distribution mellan regioner, medan Python SDK eller REST stöder.

Important

När du har distribuerat en anpassad modell tas distributionen bort om distributionen förblir inaktiv i mer än femton (15) dagar. Distributionen av en anpassad modell är inaktiv om modellen distribuerades för mer än femton (15) dagar sedan och inga slutföranden eller samtal om chattavslut gjordes till den under en kontinuerlig 15-dagarsperiod.

Borttagningen av en inaktiv distribution tar inte bort eller påverkar inte den underliggande anpassade modellen, och den anpassade modellen kan distribueras om när som helst. Såsom det beskrivs i Prissättningen för Azure OpenAI i Azure AI Foundry Models, medför varje anpassad (finjusterad) modell som distribueras en timkostnad för drift oavsett om slutföranden eller chattkompletteringar görs med modellen. Mer information om hur du planerar och hanterar kostnader med Azure OpenAI finns i vägledningen i Planera för att hantera kostnader för Azure OpenAI.

Använd din distribuerade finjusterade modell

När din anpassade modell har distribuerats kan du använda den som vilken annan distribuerad modell som helst. Du kan använda Playgrounds i Azure AI Foundry-portalen för att experimentera med din nya distribution. Du kan fortsätta att använda samma parametrar med din anpassade modell, till exempel temperature och max_tokens, som du kan med andra distribuerade modeller.

Skärmbild av playground-fönstret i Azure AI Foundry-portalen med avsnitt markerade.

Snabb cachelagring

Azure OpenAI-finjustering stöder cachelagring av frågeuppmaningar med utvalda modeller. Med cachelagring av frågor kan du minska den totala svarstiden och kostnaden för längre frågor som har identiskt innehåll i början av prompten. För att lära dig mer om cachelagring av frågor, se komma igång med cachelagring av frågor.

Distributionstyper

Azure OpenAI-finjustering stöder följande distributionstyper.

Standard

Standarddistributioner tillhandahåller en faktureringsmodell för betalning per token med datahemvist begränsat till den distribuerade regionen.

Models Östra USA 2 Norra centrala USA Centrala Sverige Switzerland West
o4-mini
GPT-4.1
GPT-4.1-mini
GPT-4.1-nano
GPT-4o
GPT-4o-mini
GPT-35-Turbo (1106)
GPT-35-Turbo (0125)

Global Standard

Globala finjusterade standarddistributioner ger kostnadsbesparingar, men anpassade modellvikter kan tillfälligt lagras utanför azure OpenAI-resursens geografiska område.

Globala standarddistributioner är tillgängliga från alla Azure OpenAI-regioner för följande modeller:

  • o4-mini
  • GPT-4.1
  • GPT-4.1-mini
  • GPT-4.1-nano
  • GPT-4o
  • GPT-4o-mini

Skärmbild av användarupplevelsen för global standarddistribution med en finjusterad modell.

Utvecklarnivå

Utvecklarnas finjusterade distributioner erbjuder en liknande upplevelse som Global Standard utan en timbaserad värdavgift, men erbjuder inte ett serviceavtal för tillgänglighet. Utvecklardistributioner är utformade för modellkandidatutvärdering och inte för produktionsanvändning.

Utvecklardistributioner är tillgängliga från alla Azure OpenAI-regioner för följande modeller:

  • GPT-4.1
  • GPT-4.1-mini
  • GPT-4.1-nano

Etablerat dataflöde

Models Norra centrala USA Centrala Sverige
GPT-4.1
GPT-4o
GPT-4o-mini

Finjusterade distributioner av tilldelad kapacitet ger förutsägbar prestanda för svarstidskänsliga agenter och applikationer. De använder samma provisionerade dataflödeskapacitet (PTU) som basmodeller, så om du redan har en regional PTU-kvot kan du distribuera din finjusterad modell i stödregioner.

Rensa din distributionen

Om du vill ta bort en distribution använder du Distributioner – Ta bort REST API och skickar en HTTP DELETE till distributionsresursen. Precis som när du skapar distributioner måste du inkludera följande parametrar:

  • Azure-prenumerations-ID
  • Namn på Azure-resursgrupp
  • Azure OpenAI-resursnamn
  • Namnet på distributionen som ska tas bort

Nedan visas REST API-exemplet för att ta bort en distribution:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2024-10-21" \
  -H "Authorization: Bearer <TOKEN>"

Du kan också ta bort en distribution i Azure AI Foundry-portalen eller använda Azure CLI.

Nästa steg