Automatisk skalning i Azure App Service

2025-04-18

Anteckning

Automatisk skalning är tillgänglig för alla apptyper: Windows och Linux (distribuera som kod och container). Automatisk skalning stöds inte för distributionsfacktrafik.

Automatisk skalning är ett utskalningsalternativ som automatiskt hanterar skalningsbeslut för dina webbappar och App Service-planer. Det skiljer sig från Autoskalning i Azure, där du kan definiera skalningsregler baserat på scheman och resurser.

Med automatisk skalning kan du justera skalningsinställningarna för att förbättra appens prestanda och undvika problem med kallstart. Plattformen förvärmer instanser för att fungera som en buffert vid utskalning, vilket säkerställer en smidig övergång i prestanda. Du debiteras per sekund för varje instans, inklusive förvärmade instanser.

I följande tabell jämförs alternativen för utskalning och inskalning som är tillgängliga i App Service:

	Manuell	Automatisk skalning	Automatisk skalning
Tillgängliga prisnivåer	Grundläggande och uppåt	Standard och uppåt	Prisnivåer för Premium V2 (P1V2, P2V2 och P3V2). Premium V3 (P0V3, P1V3, P2V3, P3V3, P1MV3, P2MV3, P3MV3, P4MV3 och P5MV3) prisnivåer.
Regelbaserad skalning	Nej	Ja	Nej, plattformen hanterar utskalning och inskalning baserat på HTTP-trafik.
Schemabaserad skalning	Nej	Ja	Nej
Alltid beredda instanser	Nej, webbappen körs på antalet manuellt skalbara instanser.	Nej, din webbapp körs på andra instanser som är tillgängliga under utskalningsåtgärden, baserat på det tröskelvärde som definierats för autoskalningsregler.	Ja (minst 1)
Förinställda instanser	Nej	Nej	Ja (standard 1)
Per app maximalt	Nej	Nej	Ja

Så här fungerar automatisk skalning

Du aktiverar automatisk skalning för en App Service-plan och konfigurerar ett antal instanser för var och en av webbapparna. När webbappen börjar ta emot HTTP-trafik övervakar App Service belastningen och lägger till instanser. Resurser kan delas när flera webbappar i en App Service-plan krävs för att skala ut samtidigt.

Här följer några scenarier där du bör skala ut automatiskt:

Du vill inte konfigurera regler för autoskalning baserat på resursmått.
Du vill att dina webbappar inom samma App Service-plan ska skalas olika och oberoende av varandra.
Webbappen är ansluten till en databas eller ett äldre system som kanske inte skalas lika snabbt som webbappen. Med skalning kan du automatiskt ange det maximala antal instanser som din App Service-plan kan skala till. Den här inställningen hjälper webbappen att inte överbelasta serverdelen.

Aktivera automatisk skalning

Inställningen Maximal burst representerar det högsta antalet instanser som din App Service-plan kan öka till baserat på inkommande HTTP-begäranden. För Premium v2- och v3-abonnemang kan du ange upp till 30 instanser. Det maximala burst-antalet måste vara lika med eller större än det antal arbetare som angetts för App Service-planen.

Azure-portalen
Azure CLI

Om du vill aktivera automatisk skalning går du till webbappens vänstra meny. Under Inställningar väljer du Skala ut (App Service-plan). Välj Automatisk, uppdatera högsta burst-värde och välj knappen Spara .

Skärmbild som visar automatisk skalning i Azure-portalen

Följande kommando aktiverar automatisk skalning för din befintliga App Service-plan och webbappar i den här planen:

az appservice plan update --name <APP_SERVICE_PLAN> --resource-group <RESOURCE_GROUP> --elastic-scale true --max-elastic-worker-count <YOUR_MAX_BURST>

Anteckning

Om du får felmeddelandet Operation returned an invalid status 'Bad Request'kan du prova att använda en annan resursgrupp eller skapa en ny.

Ange det minsta antalet webbappinstanser

Inställningen Alltid redo instanser på appnivå anger det minsta antalet instanser. Om belastningen överskrider det minsta antal som anges i Always ready-instanser läggs ytterligare instanser till, upp till det angivna högsta burst-värdet för App Service-planen.

Azure-portalen
Azure CLI

Om du vill ange det minsta antalet webbappsinstanser går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Uppdatera värdet Always ready instances (Alltid redo instanser) och välj knappen Spara.

Skärmbild av alltid redo instanser.

Om du vill ange det minsta antalet webbappinstanser använder du följande kommando:

 az webapp update --resource-group <RESOURCE_GROUP> --name <APP_NAME> --minimum-elastic-instance-count <ALWAYS_READY_COUNT>

Ange det maximala antalet webbappinstanser

Värdet Maximal skalningsgräns anger det maximala antalet instanser som en webbapp kan skala till. Den maximala skalningsgränsen är användbar när en underordnad komponent som en databas har begränsat dataflöde. Maxvärdet per app kan vara mellan 1 och det maximala burst-värdet.

Azure-portalen
Azure CLI

Om du vill ange det maximala antalet webbappsinstanser går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Välj Framtvinga utskalningsgräns, uppdatera gränsen för maximal skalning och välj knappen Spara.

Skärmbild av maximal skalningsgräns.

Uppdatera förinställda instanser

Den förvärmda instansinställningen tillhandahåller varma instanser som en buffert under HTTP-skalnings- och aktiveringshändelser. Förvärmda instanser fortsätter att buffra tills det maximala skalningsgränsen har nåtts. Standardantalet för förvärmd instans är 1 och för de flesta scenarier bör det här värdet förbli som 1.

Azure-portalen
Azure CLI

Du kan inte ändra inställningen för förvärmd instans i portalen. Du måste i stället använda Azure CLI.

Du kan ändra antalet förvärmda instanser för en app genom Azure CLI.

 az webapp update --resource-group <RESOURCE_GROUP> --name <APP_NAME> --prewarmed-instance-count <PREWARMED_COUNT>

Om du vill inaktivera automatisk skalning går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Välj Manuell och välj knappen Spara .

Skärmbild av manuell skalning.

Följande kommando inaktiverar automatisk skalning för din befintliga App Service-plan och alla webbappar i den här planen:

az appservice plan update --resource-group <RESOURCE_GROUP> --name <APP_SERVICE_PLAN> --elastic-scale false

Vanliga frågor och svar

Stöder automatisk skalning Azure Functions-appar?

Nej, du kan bara ha Azure App Service-webbappar i App Service-planen där du vill aktivera automatisk skalning. För Azure Functions-appar rekommenderar vi att du använder Azure Functions Premium-planen i stället.

Varning

Automatisk skalning inaktiveras när App Service-webbappar och Azure Functions-appar finns i samma App Service-plan.

Hur fungerar automatisk skalning i bakgrunden?

Program som är inställda på automatisk skalning övervakas kontinuerligt, och arbetshälsobedömningar görs minst en gång med några sekunders mellanrum. Om systemet upptäcker ökad belastning på programmet blir hälsokontroller vanligare. Om arbetshälsan försämras och begäranden blir långsammare begärs andra instanser. Den hastighet med vilken instanser läggs till varierar beroende på det enskilda programmets belastningsmönster och starttid. Program med korta starttider och tillfälliga belastningstoppar kan se en virtuell dator läggas till med några sekunders mellanrum till en minut.

När belastningen har minskat initierar plattformen en granskning för potentiell skalning. Den här processen börjar vanligtvis cirka 5–10 minuter efter att belastningen slutar öka. Under inskalningen tas instanser bort med en maximal hastighet av en var några sekunder till en minut.

Om flera webbprogram distribueras inom samma App Service-plan försöker plattformen allokera resurser mellan tillgängliga instanser. Den här allokeringen baseras på belastningen på varje enskild webbapp.

Hur debiteras jag för förvärmda instanser?

För att förstå hur du debiteras för förvärmda instanser bör du tänka på det här scenariot: Anta att din webbapp har fem instanser som alltid är redo, tillsammans med en förvärmd instans som standardinställning.

När webbappen är inaktiv och inte tar emot några HTTP-begäranden körs den med de fem alltid redo instanserna. Under den här tiden debiteras du inte för en förvärmd instans eftersom de alltid redo-instanserna inte används och därför allokeras ingen förvärmd instans.

Dock, så snart din webbapp börjar ta emot HTTP-begäranden och de fem alltid tillgängliga instanserna blir aktiva, allokeras en förvärmd instans. Faktureringen för den börjar nu.

Om antalet HTTP-begäranden fortsätter att öka och App Service bestämmer sig för att skala utöver de fem första instanserna, börjar den använda den förvärmda instansen. Det innebär att när det finns sex aktiva instanser etableras en sjunde instans omedelbart för att fylla den förvärmda bufferten.

Den här processen för skalning och förvärmning fortsätter tills det maximala instansantalet för appen har nåtts. Det är viktigt att notera att inga instanser är förvärmda eller aktiverade utöver det maximala antalet instanser.

Varför har `AppServiceHTTPLogs` loggposter som liknar `/admin/host/ping` med statusen 404?

I App Service utförs automatisk skalning genom regelbundna kontroller av /admin/host/ping-slutpunkten samt andra hälsokontrollmekanismer som är inbyggda i plattformen. Ibland, på grund av befintliga plattformskonfigurationer, kan dessa pingar returnera 404-fel. Observera dock att dessa 404-fel inte bör påverka appens tillgänglighet eller skalningsprestanda.

Om webbappen returnerar statusen 5xx kan dessa slutpunkts pingar resultera i tillfälliga omstarter, även om det här scenariot är ovanligt. Se till att webbappen inte returnerar 5xx-status vid den här slutpunkten. Dessa pingslutpunkter kan inte anpassas.

Hur spårar jag antalet utskalade instanser under den automatiska skalningshändelsen?

Metriken AutomaticScalingInstanceCount rapporterar antalet virtuella datorer som appen körs på, inklusive den förvärmda instansen om den har distribuerats. Det här måttet kan också användas för att spåra det maximala antalet instanser som din webbapp skalar ut under en automatisk skalningshändelse. Det här måttet är endast tillgängligt för appar som har automatisk skalning aktiverat.

Hur påverkar ARR Affinity automatisk skalning?

Azure App Service använder Application Request Routing-kakor, kända som ARR Affinity. ARR-tillhörighetscookies begränsar skalningen eftersom de endast skickar begäranden till servrar som är associerade med cookien, i stället för någon tillgänglig instans. För appar som lagrar tillstånd är det bättre att skala upp (öka resurserna på en enda instans). För tillståndslösa appar ger utskalning (lägga till fler instanser) mer flexibilitet och skalbarhet. ARR-tillhörighetscookies är aktiverade som standard i App Service. Beroende på dina programbehov kan du välja att inaktivera ARR-tillhörighetscookies när du använder automatisk skalning.

Inaktivera ARR-tillhörighetscookies: välj din App Service-app och under Inställningar väljer du Konfiguration. Välj sedan fliken Allmänna inställningar . Under Sessionstillhörighet väljer du Av och sedan knappen Spara .

Feedback

Var den här sidan till hjälp?