Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Anteckning
Automatisk skalning är tillgänglig för alla apptyper: Windows och Linux (distribuera som kod och container). Automatisk skalning stöds inte för distributionsfacktrafik.
Automatisk skalning är ett utskalningsalternativ som automatiskt hanterar skalningsbeslut för dina webbappar och App Service-planer. Det skiljer sig från Autoskalning i Azure, där du kan definiera skalningsregler baserat på scheman och resurser.
Med automatisk skalning kan du justera skalningsinställningarna för att förbättra appens prestanda och undvika problem med kallstart. Plattformen förvärmer instanser för att fungera som en buffert vid utskalning, vilket säkerställer en smidig övergång i prestanda. Du debiteras per sekund för varje instans, inklusive förvärmade instanser.
I följande tabell jämförs alternativen för utskalning och inskalning som är tillgängliga i App Service:
| Manuell | Automatisk skalning | Automatisk skalning | |
|---|---|---|---|
| Tillgängliga prisnivåer | Grundläggande och uppåt | Standard och uppåt | Prisnivåer för Premium V2 (P1V2, P2V2 och P3V2). Premium V3 (P0V3, P1V3, P2V3, P3V3, P1MV3, P2MV3, P3MV3, P4MV3 och P5MV3) prisnivåer. | 
| Regelbaserad skalning | Nej | Ja | Nej, plattformen hanterar utskalning och inskalning baserat på HTTP-trafik. | 
| Schemabaserad skalning | Nej | Ja | Nej | 
| Alltid beredda instanser | Nej, webbappen körs på antalet manuellt skalbara instanser. | Nej, din webbapp körs på andra instanser som är tillgängliga under utskalningsåtgärden, baserat på det tröskelvärde som definierats för autoskalningsregler. | Ja (minst 1) | 
| Förinställda instanser | Nej | Nej | Ja (standard 1) | 
| Per app maximalt | Nej | Nej | Ja | 
Så här fungerar automatisk skalning
Du aktiverar automatisk skalning för en App Service-plan och konfigurerar ett antal instanser för var och en av webbapparna. När webbappen börjar ta emot HTTP-trafik övervakar App Service belastningen och lägger till instanser. Resurser kan delas när flera webbappar i en App Service-plan krävs för att skala ut samtidigt.
Här följer några scenarier där du bör skala ut automatiskt:
- Du vill inte konfigurera regler för autoskalning baserat på resursmått.
- Du vill att dina webbappar inom samma App Service-plan ska skalas olika och oberoende av varandra.
- Webbappen är ansluten till en databas eller ett äldre system som kanske inte skalas lika snabbt som webbappen. Med skalning kan du automatiskt ange det maximala antal instanser som din App Service-plan kan skala till. Den här inställningen hjälper webbappen att inte överbelasta serverdelen.
Aktivera automatisk skalning
Inställningen Maximal burst representerar det högsta antalet instanser som din App Service-plan kan öka till baserat på inkommande HTTP-begäranden. För Premium v2- och v3-abonnemang kan du ange upp till 30 instanser. Det maximala burst-antalet måste vara lika med eller större än det antal arbetare som angetts för App Service-planen.
Om du vill aktivera automatisk skalning går du till webbappens vänstra meny. Under Inställningar väljer du Skala ut (App Service-plan). Välj Automatisk, uppdatera högsta burst-värde och välj knappen Spara .
              
               
              
              
            
Ange det minsta antalet webbappinstanser
Inställningen Alltid redo instanser på appnivå anger det minsta antalet instanser. Om belastningen överskrider det minsta antal som anges i Always ready-instanser läggs ytterligare instanser till, upp till det angivna högsta burst-värdet för App Service-planen.
Om du vill ange det minsta antalet webbappsinstanser går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Uppdatera värdet Always ready instances (Alltid redo instanser) och välj knappen Spara.
              
               
              
              
            
Ange det maximala antalet webbappinstanser
Värdet Maximal skalningsgräns anger det maximala antalet instanser som en webbapp kan skala till. Den maximala skalningsgränsen är användbar när en underordnad komponent som en databas har begränsat dataflöde. Maxvärdet per app kan vara mellan 1 och det maximala burst-värdet.
Om du vill ange det maximala antalet webbappsinstanser går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Välj Framtvinga utskalningsgräns, uppdatera gränsen för maximal skalning och välj knappen Spara.
              
               
              
              
            
Uppdatera förinställda instanser
Den förvärmda instansinställningen tillhandahåller varma instanser som en buffert under HTTP-skalnings- och aktiveringshändelser. Förvärmda instanser fortsätter att buffra tills det maximala skalningsgränsen har nåtts. Standardantalet för förvärmd instans är 1 och för de flesta scenarier bör det här värdet förbli som 1.
Du kan inte ändra inställningen för förvärmd instans i portalen. Du måste i stället använda Azure CLI.
Inaktivera automatisk skalning
Om du vill inaktivera automatisk skalning går du till webbappens vänstra meny och väljer Skala ut (App Service-plan). Välj Manuell och välj knappen Spara .
              
               
              
              
            
Vanliga frågor och svar
Stöder automatisk skalning Azure Functions-appar?
Nej, du kan bara ha Azure App Service-webbappar i App Service-planen där du vill aktivera automatisk skalning. För Azure Functions-appar rekommenderar vi att du använder Azure Functions Premium-planen i stället.
Varning
Automatisk skalning inaktiveras när App Service-webbappar och Azure Functions-appar finns i samma App Service-plan.
Hur fungerar automatisk skalning i bakgrunden?
Program som är inställda på automatisk skalning övervakas kontinuerligt, och arbetshälsobedömningar görs minst en gång med några sekunders mellanrum. Om systemet upptäcker ökad belastning på programmet blir hälsokontroller vanligare. Om arbetshälsan försämras och begäranden blir långsammare begärs andra instanser. Den hastighet med vilken instanser läggs till varierar beroende på det enskilda programmets belastningsmönster och starttid. Program med korta starttider och tillfälliga belastningstoppar kan se en virtuell dator läggas till med några sekunders mellanrum till en minut.
När belastningen har minskat initierar plattformen en granskning för potentiell skalning. Den här processen börjar vanligtvis cirka 5–10 minuter efter att belastningen slutar öka. Under inskalningen tas instanser bort med en maximal hastighet av en var några sekunder till en minut.
Om flera webbprogram distribueras inom samma App Service-plan försöker plattformen allokera resurser mellan tillgängliga instanser. Den här allokeringen baseras på belastningen på varje enskild webbapp.
Hur debiteras jag för förvärmda instanser?
För att förstå hur du debiteras för förvärmda instanser bör du tänka på det här scenariot: Anta att din webbapp har fem instanser som alltid är redo, tillsammans med en förvärmd instans som standardinställning.
När webbappen är inaktiv och inte tar emot några HTTP-begäranden körs den med de fem alltid redo instanserna. Under den här tiden debiteras du inte för en förvärmd instans eftersom de alltid redo-instanserna inte används och därför allokeras ingen förvärmd instans.
Dock, så snart din webbapp börjar ta emot HTTP-begäranden och de fem alltid tillgängliga instanserna blir aktiva, allokeras en förvärmd instans. Faktureringen för den börjar nu.
Om antalet HTTP-begäranden fortsätter att öka och App Service bestämmer sig för att skala utöver de fem första instanserna, börjar den använda den förvärmda instansen. Det innebär att när det finns sex aktiva instanser etableras en sjunde instans omedelbart för att fylla den förvärmda bufferten.
Den här processen för skalning och förvärmning fortsätter tills det maximala instansantalet för appen har nåtts. Det är viktigt att notera att inga instanser är förvärmda eller aktiverade utöver det maximala antalet instanser.
Varför har AppServiceHTTPLogs loggposter som liknar /admin/host/ping med statusen 404?
I App Service utförs automatisk skalning genom regelbundna kontroller av /admin/host/ping-slutpunkten samt andra hälsokontrollmekanismer som är inbyggda i plattformen. Ibland, på grund av befintliga plattformskonfigurationer, kan dessa pingar returnera 404-fel. Observera dock att dessa 404-fel inte bör påverka appens tillgänglighet eller skalningsprestanda.
Om webbappen returnerar statusen 5xx kan dessa slutpunkts pingar resultera i tillfälliga omstarter, även om det här scenariot är ovanligt. Se till att webbappen inte returnerar 5xx-status vid den här slutpunkten. Dessa pingslutpunkter kan inte anpassas.
Hur spårar jag antalet utskalade instanser under den automatiska skalningshändelsen?
Metriken AutomaticScalingInstanceCount rapporterar antalet virtuella datorer som appen körs på, inklusive den förvärmda instansen om den har distribuerats. Det här måttet kan också användas för att spåra det maximala antalet instanser som din webbapp skalar ut under en automatisk skalningshändelse. Det här måttet är endast tillgängligt för appar som har automatisk skalning aktiverat.
Hur påverkar ARR Affinity automatisk skalning?
Azure App Service använder Application Request Routing-kakor, kända som ARR Affinity. ARR-tillhörighetscookies begränsar skalningen eftersom de endast skickar begäranden till servrar som är associerade med cookien, i stället för någon tillgänglig instans. För appar som lagrar tillstånd är det bättre att skala upp (öka resurserna på en enda instans). För tillståndslösa appar ger utskalning (lägga till fler instanser) mer flexibilitet och skalbarhet. ARR-tillhörighetscookies är aktiverade som standard i App Service. Beroende på dina programbehov kan du välja att inaktivera ARR-tillhörighetscookies när du använder automatisk skalning.
Inaktivera ARR-tillhörighetscookies: välj din App Service-app och under Inställningar väljer du Konfiguration. Välj sedan fliken Allmänna inställningar . Under Sessionstillhörighet väljer du Av och sedan knappen Spara .