Dela via


AksServiceDeploymentConfiguration Klass

Representerar en distributionskonfigurationsinformation för en tjänst som distribueras i Azure Kubernetes Service.

Skapa ett AksServiceDeploymentConfiguration-objekt med hjälp deploy_configuration av -klassens AksWebservice metod.

Initiera ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål.

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametrar

Name Description
cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som denna webbtjänst får använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.

autoscale_enabled
Obligatorisk

Anger om du vill aktivera automatisk skalning för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalningen ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är Sant.

cpu_cores
Obligatorisk

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet maximala samtidiga begäranden per replik som ska tillåtas för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts aktiveras autoskalningen som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

tags
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten.

properties
Obligatorisk

Ordlista med nyckelvärdesegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.

description
Obligatorisk
str

En beskrivning för att ge den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Ställs in på 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) du utför liveness-avsökningen. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
Obligatorisk
int

Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antal sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
Obligatorisk
int

Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
Obligatorisk
int

När en podd startar och liveness-avsökningen misslyckas försöker Kubernetes gånger failureThreshold innan de ger upp. Standard är 3. Minimivärdet är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. De första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som denna webbtjänst får använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.

blobfuse_enabled

Om du vill aktivera blobfuse för modellnedladdning för den här webbtjänsten eller inte. Standardvärdet är True

Standardvärde: None
autoscale_enabled
Obligatorisk

Anger om du vill aktivera automatisk skalning för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalningen ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är Sant.

cpu_cores
Obligatorisk

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet maximala samtidiga begäranden per replik som ska tillåtas för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts aktiveras autoskalningen som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

tags
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten.

properties
Obligatorisk

Ordlista med nyckelvärdesegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.

description
Obligatorisk
str

En beskrivning för att ge den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Ställs in på 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) du utför liveness-avsökningen. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
Obligatorisk
int

Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antal sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
Obligatorisk
int

Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
Obligatorisk
int

När en podd startar och liveness-avsökningen misslyckas försöker Kubernetes gånger failureThreshold innan de ger upp. Standard är 3. Minimivärdet är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. De första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

compute_target_name
Obligatorisk
str

Namnet på beräkningsmålet som ska distribueras till

cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som denna webbtjänst får använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.

blobfuse_enabled
Obligatorisk

Om du vill aktivera blobfuse för modellnedladdning för den här webbtjänsten eller inte. Standardvärdet är True

Variabler

Name Description
autoscale_enabled

Anger om du vill aktivera automatisk skalning för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
int

Hur ofta autoskalningen ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data

Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är Sant.

cpu_cores

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1

memory_gb

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False

scoring_timeout_ms
int

En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
int

Antalet maximala samtidiga begäranden per replik som ska tillåtas för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
int

Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts aktiveras autoskalningen som standard.

primary_key
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Ordlista med nyckelvärdesegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

En beskrivning för att ge den här webbtjänsten.

gpu_cores
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Ställs in på 0.

period_seconds
int

Hur ofta (i sekunder) du utför liveness-avsökningen. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
int

Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.

timeout_seconds
int

Antal sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
int

Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
int

När en podd startar och liveness-avsökningen misslyckas försöker Kubernetes gånger failureThreshold innan de ger upp. Standard är 3. Minimivärdet är 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. De första och sista tecknen får inte vara bindestreck.

token_auth_enabled

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

Metoder

print_deploy_configuration

Skriv ut distributionskonfigurationen.

validate_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

print_deploy_configuration

Skriv ut distributionskonfigurationen.

print_deploy_configuration()

validate_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_configuration()

Undantag

Typ Description