När du har finjusterat en modell kanske du vill testa dess kvalitet via API:et för chattavslut eller utvärderingstjänsten .
Med en distribution på utvecklarnivå kan du distribuera din nya modell utan den timvärdavgift som uppstår för Standard- eller Global-distributioner. De enda avgifter som debiteras är per token. Se prissättningssidan för de mest up-to-date-priser.
Viktigt!
Utvecklarnivån erbjuder inget serviceavtal för tillgänglighet och inga garantier för datahemvist . Om du behöver ett serviceavtal eller datahemvist väljer du en alternativ distributionstyp för att testa din modell.
Distributioner på utvecklarnivå har en fast livslängd på 24 timmar. Läs mer nedan om distributionens livscykel.
Distribuera din finjusterade modell
Om du vill distribuera din modellkandidat väljer du den finjusterade modell som ska distribueras och väljer sedan Distribuera.
Dialogrutan Distribuera modell öppnas. I dialogrutan anger du distributionsnamnet och väljer sedan Utvecklare i listrutan distributionstyp. Välj Skapa för att starta distributionen av din anpassade modell.
Du kan övervaka förloppet för den nya distributionen i fönstret Distributioner i Azure AI Foundry-portalen.
import json
import os
import requests
token = os.getenv("<TOKEN>")
subscription = "<YOUR_SUBSCRIPTION_ID>"
resource_group = "<YOUR_RESOURCE_GROUP_NAME>"
resource_name = "<YOUR_AZURE_OPENAI_RESOURCE_NAME>"
model_deployment_name = "gpt41-mini-candidate-01" # custom deployment name that you will use to reference the model when making inference calls.
deploy_params = {'api-version': "2025-07-01-preview"}
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}
deploy_data = {
"sku": {"name": "developertier", "capacity": 50},
"properties": {
"model": {
"format": "OpenAI",
"name": <"fine_tuned_model">, #retrieve this value from the previous call, it will look like gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83
"version": "1"
}
}
}
deploy_data = json.dumps(deploy_data)
request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'
print('Creating a new deployment...')
r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)
print(r)
print(r.reason)
print(r.json())
| variabel |
Definition |
| tecken |
Det finns flera sätt att generera en auktoriseringstoken. Den enklaste metoden för inledande testning är att starta Cloud Shell från Azure Portal. Kör sedan az account get-access-token. Du kan använda den här token som din tillfälliga auktoriseringstoken för API-testning. Vi rekommenderar att du lagrar detta i en ny miljövariabel. |
| prenumeration |
Prenumerations-ID för den associerade Azure OpenAI-resursen. |
| resursgrupp |
Resursgruppens namn för din Azure OpenAI-resurs. |
| resursnamn |
Namnet på Azure OpenAI-resursen. |
| modellutplaceringsnamn |
Det anpassade namnet för din nya finjusterade modellutplacering. Det här är det namn som ska refereras till i koden när du gör samtal om chattens slutförande. |
| finjusterad modell |
Hämta det här värdet från finjusteringens resultat i föregående steg. Det kommer att se ut som gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83. Du måste lägga till det värdet i deploy_data json. Du kan också distribuera en kontrollpunkt genom att skicka kontrollpunkts-ID:t som visas i formatet ftchkpt-e559c011ecc04fc68eaa339d8227d02d |
I följande exempel visas hur du använder REST API för att skapa en modelldistribution för din anpassade modell. REST-API:et genererar ett namn för distributionen av din anpassade modell.
curl -X POST "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
-H "Authorization: Bearer <TOKEN>" \
-H "Content-Type: application/json" \
-d '{
"sku": {"name": "developertier", "capacity": 50},
"properties": {
"model": {
"format": "OpenAI",
"name": "<FINE_TUNED_MODEL>",
"version": "1"
}
}
}'
| variabel |
Definition |
| tecken |
Det finns flera sätt att generera en auktoriseringstoken. Den enklaste metoden för inledande testning är att starta Cloud Shell från Azure Portal. Kör sedan az account get-access-token. Du kan använda den här token som din tillfälliga auktoriseringstoken för API-testning. Vi rekommenderar att du lagrar detta i en ny miljövariabel. |
| prenumeration |
Prenumerations-ID för den associerade Azure OpenAI-resursen. |
| resursgrupp |
Resursgruppens namn för din Azure OpenAI-resurs. |
| resursnamn |
Namnet på Azure OpenAI-resursen. |
| modellutplaceringsnamn |
Det anpassade namnet för din nya finjusterade modellutplacering. Det här är det namn som ska refereras till i koden när du gör samtal om chattens slutförande. |
| finjusterad modell |
Hämta det här värdet från finjusteringens resultat i föregående steg. Det kommer att se ut som gpt-35-turbo-0125.ft-b044a9d3cf9c4228b5d393567f693b83. Du måste lägga till det värdet i deploy_data json. Du kan också distribuera en kontrollpunkt genom att skicka kontrollpunkts-ID:t som visas i formatet ftchkpt-e559c011ecc04fc68eaa339d8227d02d |
Distribuera en modell med Azure CLI
I följande exempel visas hur du använder Azure CLI för att distribuera din anpassade modell. Med Azure CLI måste du ange ett namn för distributionen av din anpassade modell. Mer information om hur du använder Azure CLI för att distribuera anpassade modeller finns i az cognitiveservices account deployment.
Om du vill köra det här Azure CLI-kommandot i ett konsolfönster måste du ersätta följande <platshållare> med motsvarande värden för din anpassade modell:
| Platshållare |
Värde |
|
<YOUR_AZURE_SUBSCRIPTION> |
Namnet eller ID:t för din Azure-prenumeration. |
|
<YOUR_RESOURCE_GROUP> |
Namnet på din Azure-resursgrupp. |
|
<YOUR_RESOURCE_NAME> |
Namnet på din Azure OpenAI-resurs. |
|
<YOUR_DEPLOYMENT_NAME> |
Det namn som du vill använda för modellens distribution. |
|
<YOUR_FINE_TUNED_MODEL_ID> |
Namnet på din anpassade modell. |
az cognitiveservices account deployment create
--resource-group <YOUR_RESOURCE_GROUP>
--name <YOUR_RESOURCE_NAME>
--deployment-name <YOUR_DEPLOYMENT_NAME>
--model-name <YOUR_FINE_TUNED_MODEL_ID>
--model-version "1"
--model-format OpenAI
--sku-capacity "50"
--sku-name "Developer"
Använd din distribuerade finjusterade modell
När din anpassade modell har distribuerats kan du använda den som vilken annan distribuerad modell som helst. Du kan använda Playgrounds i Azure AI Foundry-portalen för att experimentera med din nya distribution. Du kan fortsätta att använda samma parametrar med din anpassade modell, till exempel temperature och max_tokens, som du kan med andra distribuerade modeller.
Du kan också använda utvärderingstjänsten för att skapa och köra modellutvärderingar mot din distribuerade modellkandidat samt andra modellversioner.
import os
from openai import OpenAI
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
)
response = client.chat.completions.create(
model="gpt41-mini-candidate-01", # model = "Custom deployment name you chose for your fine-tuning model"
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},
{"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},
{"role": "user", "content": "Do other Azure AI services support this too?"}
]
)
print(response.choices[0].message.content)
curl $AZURE_OPENAI_ENDPOINT/openai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-d '"model": "YOUR_MODEL_DEPLOYMENT_NAME", {"messages":[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},{"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},{"role": "user", "content": "Do other Azure AI services support this too?"}]}'
Rensa din distributionen
Utvecklardistributioner tas bort automatiskt på egen hand oavsett aktivitet. Varje distribution har en fast livslängd på 24 timmar efter vilken den kan tas bort. Borttagningen av en distribution tar inte bort eller påverkar inte den underliggande anpassade modellen och den anpassade modellen kan distribueras om när som helst.
Om du vill ta bort en distribution manuellt kan du använda Azure AI Foundry-portalen eller använda Azure CLI.
Om du vill använda Distributioner – Ta bort REST API skickar du en HTTP DELETE till distributionsresursen. Precis som när du skapar distributioner måste du inkludera följande parametrar:
- Azure-prenumerations-ID
- Namn på Azure-resursgrupp
- Azure OpenAI-resursnamn
- Namnet på distributionen som ska tas bort
Nedan visas REST API-exemplet för att ta bort en distribution:
curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
-H "Authorization: Bearer <TOKEN>"
Nästa steg