AksWebservice Klass
Representerar en maskininlärningsmodell som distribuerats som en webbtjänstslutpunkt i Azure Kubernetes Service.
En distribuerad tjänst skapas från en modell, ett skript och associerade filer. Den resulterande webbtjänsten är en belastningsbalanserad HTTP-slutpunkt med ett REST-API. Du kan skicka data till det här API:et och ta emot förutsägelsen som returneras av modellen.
AksWebservice distribuerar en enda tjänst till en slutpunkt. Om du vill distribuera flera tjänster till en slutpunkt använder du AksEndpoint klassen .
Mer information finns i Distribuera en modell till ett Azure Kubernetes Service-kluster.
Initiera Webservice-instansen.
Webbtjänstkonstruktorn hämtar en molnrepresentation av ett webbtjänstobjekt som är associerat med den angivna arbetsytan. Den returnerar en instans av en underordnad klass som motsvarar den specifika typen av det hämtade webbtjänstobjektet.
Konstruktor
AksWebservice(workspace, name)
Parametrar
| Name | Description |
|---|---|
|
workspace
Obligatorisk
|
Arbetsyteobjektet som innehåller webbtjänstobjektet som ska hämtas. |
|
name
Obligatorisk
|
Namnet på det Webservice-objekt som ska hämtas. |
Kommentarer
Det rekommenderade distributionsmönstret är att skapa ett distributionskonfigurationsobjekt med deploy_configuration -metoden och sedan använda det med deploy metoden för Model klassen enligt nedan.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Det finns ett antal sätt att distribuera en modell som en webbtjänst, bland annat med:
deploymetoden för för modeller som Model redan har registrerats på arbetsytan.deploy_from_image-metod för Webservice.deploy_from_modelWebservice metod för modeller som redan har registrerats på arbetsytan. Den här metoden skapar en avbildning.deploy-metoden för Webservice, som registrerar en modell och skapar en avbildning.
Information om hur du arbetar med webbtjänster finns i
Konsumera en Azure Machine Learning-modell som distribuerats som en webbtjänst
Se Övervaka och samla in data från webbtjänstslutpunkter i ML
I avsnittet Variabler visas attribut för en lokal representation av molnets AksWebservice-objekt. Dessa variabler bör betraktas som skrivskyddade. Att ändra deras värden återspeglas inte i motsvarande molnobjekt.
Variabler
| Name | Description |
|---|---|
|
enable_app_insights
|
Om AppInsights-loggning är aktiverad för webbtjänsten eller inte. |
|
autoscaler
|
Autoskalningsobjektet för webbtjänsten. |
|
compute_name
|
Namnet på den ComputeTarget som webbtjänsten distribueras till. |
|
container_resource_requirements
|
Kraven för containerresursen för webbtjänsten. |
|
liveness_probe_requirements
|
Krav för liveness-avsökning för webbtjänsten. |
|
data_collection
|
DataCollection-objektet för webbtjänsten. |
|
max_concurrent_requests_per_container
|
Det maximala antalet samtidiga begäranden per container för webbtjänsten. |
|
max_request_wait_time
|
Den maximala väntetiden för begäran för webbtjänsten i millisekunder. |
|
num_replicas
|
Antalet repliker för webbtjänsten. Varje replik motsvarar en AKS-podd. |
|
scoring_timeout_ms
|
Tidsgränsen för bedömning för webbtjänsten i millisekunder. |
|
azureml.core.webservice.AksWebservice.scoring_uri
|
Slutpunkten för bedömning för webbtjänsten |
|
is_default
|
Om webbtjänsten är standardversionen för den överordnade AksEndpoint. |
|
traffic_percentile
|
Vilken procentandel av trafiken som ska dirigeras till webbtjänsten i den överordnade AksEndpoint. |
|
version_type
|
Versionstypen för webbtjänsten i den överordnade AksEndpoint. |
|
token_auth_enabled
|
Huruvida tokenautentisering är aktiverat för webbtjänsten eller inte. |
|
environment
|
Miljöobjektet som användes för att skapa webbtjänsten. |
|
azureml.core.webservice.AksWebservice.models
|
En lista över modeller som distribuerats till webbtjänsten. |
|
deployment_status
|
Distributionsstatus för webbtjänsten. |
|
namespace
|
AKS-namnområdet för webbtjänsten. |
|
azureml.core.webservice.AksWebservice.swagger_uri
|
Swagger-slutpunkten för webbtjänsten. |
Metoder
| add_properties |
Lägg till nyckelvärdepar i den här webbtjänstens egenskapsordlista. |
| add_tags |
Lägg till nyckelvärdepar i ordlistan för den här webbtjänstens taggar. Genererar en WebserviceException. |
| deploy_configuration |
Skapa ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål. |
| get_access_token |
Hämta autentiseringstoken för den här webbtjänsten. |
| get_token |
DEPRECATED. Använd Hämta autentiseringstoken för den här webbtjänsten. |
| remove_tags |
Ta bort de angivna nycklarna från den här webbtjänstens ordlista med taggar. |
| run |
Anropa den här webbtjänsten med de angivna indata. |
| serialize |
Konvertera den här webbtjänsten till en JSON-serialiserad ordlista. |
| update |
Uppdatera webbtjänsten med angivna egenskaper. Värden kvar som Ingen förblir oförändrade i den här webbtjänsten. |
add_properties
add_tags
Lägg till nyckelvärdepar i ordlistan för den här webbtjänstens taggar.
Genererar en WebserviceException.
add_tags(tags)
Parametrar
| Name | Description |
|---|---|
|
tags
Obligatorisk
|
Ordlistan med taggar som ska läggas till. |
Undantag
| Typ | Description |
|---|---|
deploy_configuration
Skapa ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametrar
| Name | Description |
|---|---|
|
autoscale_enabled
|
Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen. Standardvärde: None
|
|
autoscale_min_replicas
|
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1. Standardvärde: None
|
|
autoscale_max_replicas
|
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10. Standardvärde: None
|
|
autoscale_refresh_seconds
|
Hur ofta autoskalningen ska försöka skala den här webbtjänsten. Standardvärdet är 1. Standardvärde: None
|
|
autoscale_target_utilization
|
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70. Standardvärde: None
|
|
collect_model_data
|
Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är False. Standardvärde: None
|
|
auth_enabled
|
Om du vill aktivera nyckelautentisering för den här webbtjänsten eller inte. Standardvärdet är Sant. Standardvärde: None
|
|
cpu_cores
|
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1. Motsvarar poddkärnbegäran, inte gränsen, i Azure Kubernetes Service. Standardvärde: None
|
|
memory_gb
|
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5. Motsvarar poddminnesbegäran, inte gränsen, i Azure Kubernetes Service. Standardvärde: None
|
|
enable_app_insights
|
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False. Standardvärde: None
|
|
scoring_timeout_ms
|
En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000. Standardvärde: None
|
|
replica_max_concurrent_requests
|
Antalet maximala samtidiga begäranden per replik som ska tillåtas för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet. Standardvärde: None
|
|
max_request_wait_time
|
Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500. Standardvärde: None
|
|
num_replicas
|
Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts aktiveras autoskalningen som standard. Standardvärde: None
|
|
primary_key
|
En primär autentiseringsnyckel som ska användas för den här webbtjänsten. Standardvärde: None
|
|
secondary_key
|
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten. Standardvärde: None
|
|
tags
|
Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten. Standardvärde: None
|
|
properties
|
Ordlista med nyckelvärdesegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till. Standardvärde: None
|
|
description
|
En beskrivning för att ge den här webbtjänsten. Standardvärde: None
|
|
gpu_cores
|
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Ställs in på 0. Standardvärde: None
|
|
period_seconds
|
Hur ofta (i sekunder) du utför liveness-avsökningen. Standardvärdet är 10 sekunder. Minimivärdet är 1. Standardvärde: None
|
|
initial_delay_seconds
|
Antalet sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310. Standardvärde: None
|
|
timeout_seconds
|
Antalet sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1. Standardvärde: None
|
|
success_threshold
|
Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1. Standardvärde: None
|
|
failure_threshold
|
När en podd startar och liveness-avsökningen misslyckas kommer Kubernetes att försöka felDå gånger innan de ger upp. Standard är 3. Minimivärdet är 1. Standardvärde: None
|
|
namespace
|
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. De första och sista tecknen får inte vara bindestreck. Standardvärde: None
|
|
token_auth_enabled
|
Om tokenautentisering ska aktiveras eller inte för den här webbtjänsten. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta en åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False. Standardvärde: None
|
|
compute_target_name
|
Namnet på beräkningsmålet som ska distribueras till Standardvärde: None
|
|
cpu_cores_limit
|
Det maximala antalet processorkärnor som denna webbtjänst får använda. Kan vara en decimal. Standardvärde: None
|
|
memory_gb_limit
|
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
|
blobfuse_enabled
|
Om du vill aktivera blobfuse för modellnedladdning för den här webbtjänsten eller inte. Standardvärdet är True Standardvärde: None
|
Returer
| Typ | Description |
|---|---|
|
Ett konfigurationsobjekt som ska användas när du distribuerar en AksWebservice. |
Undantag
| Typ | Description |
|---|---|
get_access_token
Hämta autentiseringstoken för den här webbtjänsten.
get_access_token()
Returer
| Typ | Description |
|---|---|
|
Ett objekt som beskriver autentiseringstoken för den här webbtjänsten. |
Undantag
| Typ | Description |
|---|---|
get_token
DEPRECATED. Använd get_access_token metoden i stället.
Hämta autentiseringstoken för den här webbtjänsten.
get_token()
Returer
| Typ | Description |
|---|---|
|
Autentiseringstoken för den här webbtjänsten och när den ska uppdateras. |
Undantag
| Typ | Description |
|---|---|
remove_tags
run
Anropa den här webbtjänsten med de angivna indata.
run(input_data)
Parametrar
| Name | Description |
|---|---|
|
input_data
Obligatorisk
|
<xref:varies>
Indata för att anropa webbtjänsten med |
Returer
| Typ | Description |
|---|---|
|
Resultatet av att anropa webbtjänsten |
Undantag
| Typ | Description |
|---|---|
serialize
Konvertera den här webbtjänsten till en JSON-serialiserad ordlista.
serialize()
Returer
| Typ | Description |
|---|---|
|
JSON-representationen av den här webbtjänsten. |
update
Uppdatera webbtjänsten med angivna egenskaper.
Värden kvar som Ingen förblir oförändrade i den här webbtjänsten.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametrar
| Name | Description |
|---|---|
|
image
|
En ny avbildning som ska distribueras till webbtjänsten Standardvärde: None
|
|
autoscale_enabled
|
Aktivera eller inaktivera automatisk skalning av den här webbtjänsten Standardvärde: None
|
|
autoscale_min_replicas
|
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten Standardvärde: None
|
|
autoscale_max_replicas
|
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten Standardvärde: None
|
|
autoscale_refresh_seconds
|
Hur ofta autoskalningen ska försöka skala den här webbtjänsten Standardvärde: None
|
|
autoscale_target_utilization
|
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten Standardvärde: None
|
|
collect_model_data
|
Aktivera eller inaktivera modelldatainsamling för den här webbtjänsten Standardvärde: None
|
|
auth_enabled
|
Om du vill aktivera autentisering för den här webbtjänsten eller inte Standardvärde: None
|
|
cpu_cores
|
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal Standardvärde: None
|
|
memory_gb
|
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal Standardvärde: None
|
|
enable_app_insights
|
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte Standardvärde: None
|
|
scoring_timeout_ms
|
En tidsgräns för att framtvinga för bedömning av anrop till den här webbtjänsten Standardvärde: None
|
|
replica_max_concurrent_requests
|
Antalet maximala samtidiga begäranden per replik som ska tillåtas för den här webbtjänsten. Standardvärde: None
|
|
max_request_wait_time
|
Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras Standardvärde: None
|
|
num_replicas
|
Antalet containrar som ska allokeras för den här webbtjänsten Standardvärde: None
|
|
tags
|
Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten. Ersätter befintliga taggar. Standardvärde: None
|
|
properties
|
Ordlista med nyckelvärdesegenskaper som ska läggas till i en befintlig egenskapsordlista Standardvärde: None
|
|
description
|
En beskrivning för att ge den här webbtjänsten Standardvärde: None
|
|
models
|
En lista över modellobjekt som ska paketeras med den uppdaterade tjänsten Standardvärde: None
|
|
inference_config
|
Ett InferenceConfig-objekt som används för att tillhandahålla de nödvändiga modelldistributionsegenskaperna. Standardvärde: None
|
|
gpu_cores
|
Antalet gpu-kärnor som ska allokeras för den här webbtjänsten Standardvärde: None
|
|
period_seconds
|
Hur ofta (i sekunder) du utför liveness-avsökningen. Standardvärdet är 10 sekunder. Minimivärdet är 1. Standardvärde: None
|
|
initial_delay_seconds
|
Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärde: None
|
|
timeout_seconds
|
Antal sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 1 sekund. Minimivärdet är 1. Standardvärde: None
|
|
success_threshold
|
Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1. Standardvärde: None
|
|
failure_threshold
|
När en podd startar och liveness-avsökningen misslyckas kommer Kubernetes att försöka felDå gånger innan de ger upp. Standard är 3. Minimivärdet är 1. Standardvärde: None
|
|
namespace
|
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. De första och sista tecknen får inte vara bindestreck. Standardvärde: None
|
|
token_auth_enabled
|
Om tokenautentisering ska aktiveras eller inte för den här webbtjänsten. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False Standardvärde: None
|
|
cpu_cores_limit
|
Det maximala antalet processorkärnor som denna webbtjänst får använda. Kan vara en decimal. Standardvärde: None
|
|
memory_gb_limit
|
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
|
kwargs
Obligatorisk
|
<xref:varies>
inkludera params som stöd för migrering av AKS-webbtjänsten till Kubernetes onlineslutpunkt och distribution. is_migration=True|False, compute_target=<compute target med AzureML-tillägget installerat som värd för migrerad Kubernetes onlineslutpunkt och distribution>. |
Undantag
| Typ | Description |
|---|---|