Dela via


Analysera hälsotillståndet och statusen för ditt Kubernetes-kluster med Azure Monitor

Azure Monitor tillhandahåller en uppsättning vyer i Azure-portalen som kombinerar prestanda- och loggdata som samlats in från ditt Kubernetes-kluster för att hjälpa dig att analysera dess hälsa och prestanda. Den här artikeln beskriver de olika vyer som är tillgängliga och hur du interagerar med och tolkar de data de presenterar.

Vy över flera kluster

Om du vill öppna vyn för flera kluster väljer du Containrar i avsnittet Insikter på menyn Övervaka i Azure-portalen. Den här vyn visar hälsostatusen för alla övervakade Kubernetes-kluster som distribuerats mellan resursgrupper i dina prenumerationer. Med den här vyn kan du snabbt identifiera kluster som är i ett kritiskt eller felfritt tillstånd och även hjälpa dig att aktivera och konfigurera övervakning för alla kluster i din miljö. Mer information finns i Aktivera övervakning för AKS-kluster .

Skärmbild som visar ett exempel på instrumentpanelen för flera kluster i Azure Monitor.

Kommentar

Azure Stack (förhandsversion) och icke-Azure (förhandsversion) stöds inte längre i den här vyn.

Välj kolumnen Noder för att öppna fliken Noder i vyn med ett kluster för klustret. Öppna fliken Kontrollanter för klustret med ett lämpligt filter genom att välja kolumnen Användarpoddar eller Systempoddar .

I följande tabell beskrivs de olika hälsostatusar som visas i den här vyn. Hälsotillstånd beräknar den övergripande klusterstatusen som det sämsta av de tre tillstånden. Om något av de tre tillstånden är Okänt visar det övergripande klustertillståndet Okänt.

Läge Beskrivning
Felfri Inga problem identifieras för den virtuella datorn och fungerar efter behov.
Varning Ett eller flera problem identifieras som måste åtgärdas eller så kan hälsotillståndet bli kritiskt.
Kritiskt Ett eller flera kritiska problem identifieras som måste åtgärdas för att återställa det normala drifttillståndet som förväntat.
Unauthorized Användaren har inte de nödvändiga behörigheterna för att läsa data på arbetsytan eller i den datainsamlingsregel som samlar in data.
Hittades inte Antingen har arbetsytan, resursgruppen eller prenumerationen som innehåller arbetsytan tagits bort.
Aktivera inspelningsregler Aktivera Prometheus-inspelningsregler för att låsa upp data med högre prestanda och Prometheus-visualiseringar.
Felkonfigurerad Något gick fel.
Error Ett fel uppstod vid försök att läsa data från arbetsytan.
Inga data Data har inte rapporterats till arbetsytan under de senaste 30 minuterna.
Okänt Om tjänsten inte kunde upprätta en anslutning till noden eller podden ändras statusen till ett okänt tillstånd.
Avvaktan Övervakningskonfigurationen för Arc-aktiverade kluster tar vanligtvis cirka 5 minuter. Om klustret är frånkopplat från Azure kan den här processen fördröjas.
Väntar i X timmar Övervakningskonfigurationen för det Arc-aktiverade klustret tar längre tid än förväntat.
Misslyckades Övervakningskonfigurationen för det Arc-aktiverade klustret misslyckades.

Följande tabell innehåller en uppdelning av beräkningen som styr hälsotillståndet för ett övervakat kluster i vyn för flera kluster.

Övervakat kluster Läge Tillgänglighet
Användarpodd Felfri
Varning
Kritiskt
Okänt
100 %
90–99%
<90%
Rapporteras inte under de senaste 30 minuterna
Systempodd Felfri
Varning
Kritiskt
Okänt
100 %
Ej tillämpligt
100 %
Rapporteras inte under de senaste 30 minuterna
Nod Felfri
Varning
Kritiskt
Okänt
>85%
60–84%
<60%
Rapporteras inte under de senaste 30 minuterna

Vy för enskilt kluster

Om du vill öppna en klustervy väljer du antingen ett kluster från vyn för flera kluster eller väljer Övervaka på ett klusters meny. Den här vyn innehåller flera flikar som gör att du kan öka detaljnivån för det valda klustrets hälsa och prestanda.

Options

Skärmbild som visar visualiseringsinställningen för den enskilda klustervyn.

Option Beskrivning
Visualisering Gör att du kan välja vilken datakälla som ska användas för att fylla i vyn. Hanterade Prometheus-visualiseringar är den önskade inställningen som använder Prometheus-mått som lagras på en Azure Monitor-arbetsyta. Dessa aktiveras när du aktiverar Managed Prometheus för klustret. Log Analytics-visualiseringar använder prestandadata som lagras på en Log Analytics-arbetsyta. Du kanske inte samlar in dessa data om du inte samlar in prestandadata i loggningsprofilen. Det här alternativet är inte tillgängligt om Managed Prometheus inte är aktiverat för klustret.
Uppdatera Uppdaterar data i vyn.
Övervaka inställningar Öppnar konfigurationsinställningarna för övervakning för klustret. Mer information finns i Aktivera övervakning för AKS-kluster .
Visa Grafana Visar en lista över hanterade Grafana-instanser som är kopplade till Azure Monitor-arbetsytan för klustret. Du kan antingen öppna instrumentpaneler för instansen eller visa instansens konfiguration.
Rekommenderade aviseringar Konfigurera rekommenderade aviseringar för klustret. Mer information finns i Skapa rekommenderade aviseringar för Kubernetes-kluster .
Visa alla kluster Öppna vyn för flera kluster.

Filtrering av data

Var och en av flikarna i vyn med ett kluster innehåller alternativ för att filtrera de data som visas. Varje flik har ett filter för tidsspann för det insamlade datat. Med flikarna Noder, Kontrollanter och Containrar kan du lägga till filterdata eller efter nod eller namnområde genom att välja Lägg till filter.

Fliken Översikt

Fliken Översikt innehåller en uppsättning paneler som visar hälsotillståndet och prestandan för klustret. Flera av dessa paneler kan inaktiveras om du inte har aktiverat vissa funktioner för övervakning. I det här fallet erbjuder rutan ett alternativ för att starta introduktionsprocessen för klustret. Mer information finns i Aktivera Kubernetes-övervakning med hjälp av Azure-portalen .

Flikarna Noder, Kontrollanter och Containrar

Flikarna Noder, Kontrollanter och Containrar visar en lista över dessa resurser för klustret. Flikarna inaktiveras om du inte samlar in prestandadata för klustret. I det här fallet erbjuder fliken ett alternativ för att starta registreringsprocessen för klustret. Mer information finns i Aktivera Kubernetes-övervakning med hjälp av Azure-portalen .

Läge

Ikonerna i fältet Status anger onlinestatusen för objektet enligt beskrivningen i följande tabell.

Ikon Läge
Väntar eller pausas
Senast rapporterad körning men har inte svarat på mer än 30 minuter
Har stoppats eller misslyckats med att stoppa
Feltillstånd

Välj mått

Flikarna Noder, Kontrollanter och Containrar innehåller ett alternativ för att välja det mått som används för värdena i vyn.

Skärmbild som visar prestandavyn containernoder.

Om du vill granska minnesanvändningen går du till listrutan Mått och väljer Minnes-RSS eller Minnesarbetsuppsättning. Minnes-RSS stöds endast för Kubernetes version 1.8 och senare. Annars visar du värden för Min % som NaN %, vilket är ett numeriskt datatypvärde som representerar ett odefinierat eller icke-representativt värde.

Minnesarbetsuppsättningen visar både det inhemska minnet och det virtuella minnet (cacheminnet) som ingår och är totalt vad programmet använder. Minnes-RSS visar bara huvudminnet, vilket inte är något annat än det bosatta minnet. Det här måttet visar den faktiska kapaciteten för tillgängligt minne.

  • Internminne, eller huvudminne, är den faktiska mängden datorminne som är tillgängligt för noderna i klustret.
  • Virtuellt minne är reserverat hårddiskutrymme (cache) som används av operativsystemet för att växla data från minne till disk under minnesbelastning och sedan hämta tillbaka dem till minnet när det behövs.

Välj måttberäkning

Percentilväljaren definierar hur måttet aggregeras över det valda tidsintervallet. Rubriken för den aggregerade kolumnen ändras så att den matchar det valda alternativet.

Skärmbild som visar ett percentilval för datafiltrering.

Trendkolumn

När du hovra över stapeldiagrammet under kolumnen Trend visar varje stapel processor- eller minnesanvändning, beroende på vilket mått som väljs, inom en exempelperiod på 15 minuter. När du har valt trenddiagrammet via ett tangentbord använder du Alt+Page up-tangenten eller Alt+Page down-tangenten för att bläddra igenom varje stapel individuellt. Du får samma information som om du förde muspekaren över stapeln.

Skärmbild som visar ett hovringsexempel för trendstapeldiagram.

I nästa exempel, för den första noden i listan , aks-nodepool1-, är värdet för Containrar 25. Det här värdet är en sammanslagning av det totala antalet distribuerade containrar.

Skärmbild som visar en sammanslagning av exempel på containrar per nod.

Egenskapsfönster

Välj valfritt objekt för att öppna ett egenskapsfönster som visar egenskaperna för det markerade objektet. När en Linux-nod väljs visar avsnittet Lokal diskkapacitet även det tillgängliga diskutrymmet och procentandelen som används för varje disk som visas för noden. I det här fönstret kan du också visa Kubernetes-containerloggar (stdout/stderror), händelser och poddmått genom att välja fliken Livehändelser överst i fönstret. Mer information om den här funktionen finns i Visa Kubernetes-loggar, händelser och poddmått i realtid.

Visa loggdata

Om du vill visa loggdata för den valda resursen baserat på fördefinierade loggsökningar väljer du Visa händelser i Log Analytics i egenskapsfönstret. För mer information om data och loggfrågor, se Hur du gör frågor mot containerloggar.

Fliken Noder

I följande tabell beskrivs kolumnerna på fliken Noder .

Kolumn Beskrivning
Namn Namnet på värden.
Läge Kubernetes-vy över nodstatus.
Min %, Genomsnittlig %, 50:e %, 90:e %, 95:e %, Max % Genomsnittlig nodprocent baserat på percentil under den valda varaktigheten.
Min, Genomsnittlig, 50:e, 90:e, 95:e, Max Genomsnittliga noders faktiska värde baserat på percentilen under den valda tidsperioden. Det genomsnittliga värdet mäts från den cpu-/minnesgräns som angetts för en nod. För poddar och containrar är det det genomsnittliga värdet som rapporteras av värden.
Behållare Antal containrar.
Drifttid Representerar tiden sedan en nod startades eller startades om.
Handkontroll Endast för containrar och poddar. Den visar vilken kontrollant den finns i. Alla poddar finns inte i en kontrollant, så vissa kanske visar N/A.
Trend min %, genomsnittlig %, 50:e %, 90:e %, 95:e %, max % Stapeldiagramtrenden representerar den genomsnittliga percentilmåttprocenten för kontrollanten.

Radhierarkin på fliken Noder följer Kubernetes-objektmodellen. Expandera en nod för att visa dess poddar. Om fler än en container grupperas till en podd visas de som den sista raden i hierarkin. Du kan också visa hur många icke-poddrelaterade arbetsbelastningar som körs på värden om värden har processor- eller minnesbelastning.

Skärmbild som visar ett exempel på Kubernetes Node-hierarkin i prestandavyn.

Windows Server-containrar visas efter alla Linux-baserade noder i listan. När du expanderar en Windows Server-nod kan du visa en eller flera poddar och containrar som körs på noden. När en nod har valts visar egenskapsfönstret versionsinformation.

Skärmbild som visar en exempelnodhierarki med Windows Server-noder listade.

Virtuella Noder i Azure Container Instances som kör Linux-operativsystemet visas efter den sista AKS-klusternoden i listan. När du expanderar en virtuell nod för containerinstanser kan du visa en eller flera containerinstanser poddar och containrar som körs på noden. Mått samlas inte in och rapporteras för noder, bara för poddar.

Skärmbild som visar en exempelnodhierarki med containerinstanser listade.

Från en expanderad nod kan du öka detaljnivån från podden eller containern som körs på noden till kontrollanten för att visa prestandadata som filtrerats för kontrollanten. Välj värdet under kolumnen Controller för den specifika noden.

Skärmbild som visar detaljnivån från nod till kontrollant i prestandavyn.

Vyn Andra processer är avsedd att hjälpa dig att tydligt förstå rotorsaken till den höga resursanvändningen på noden. Den här informationen hjälper dig att skilja användningen mellan containerbaserade processer jämfört med icke-kontaineriserade processer. Det här är icke-kontaineriserade processer som körs på noden och innehåller följande:

  • Självhanterade eller hanterade Kubernetes-icke-kontaineriserade processer
  • Körningsprocesser för containrar
  • Kubelet
  • Systemprocesser som körs på noden
  • Andra icke-Kubernetes-arbetsbelastningar som körs på nodmaskinvara eller en virtuell dator

Värdet för andra processer är Total usage from CAdvisor - Usage from containerized process.

Fliken Kontroller

På fliken Kontrollanter kan du visa prestandahälsan för dina kontrollanter, virtuella nodkontrollanter och virtuella nodpoddar som inte är anslutna till en kontrollant.

Skärmbild som visar prestandavyn \<Name> controllers.

Radhierarkin börjar med en kontrollant. När du expanderar en kontrollant visar du en eller flera poddar. Expandera en podd och den sista raden visar containern grupperad till podden. Från en expanderad kontrollant kan du öka detaljnivån till den nod som den körs på för att visa prestandadata som filtrerats för den noden. Container Instances-poddar som inte är anslutna till en kontrollant visas sist i listan.

Skärmbild som visar ett exempel på en kontrollanthierarki med Container Instances-poddar listade.

Välj värdet under kolumnen Node för den specifika kontrollanten.

Skärmbild som visar ett exempel på ökad detaljnivå från kontrollant till nod i prestandavyn.

I följande tabell beskrivs kolumnerna på fliken Kontrollanter .

Kolumn Beskrivning
Namn Namnet på kontrollanten.
Läge Sammanslagningsstatusen för containrarna efter att de har körts klart. Statusikonen visar ett antal baserat på vad podden tillhandahåller. Det visar de två värsta delstaterna. När du hovrar över statusen visas en sammanslagningsstatus från alla poddar i containern. Om det inte finns något klart tillstånd visas statusvärdet (0)..
Min %, Genomsnittlig %, 50:e %, 90:e %, 95:e %, Max % Sammanslagningsmedelvärde för den genomsnittliga procentandelen av varje entitet för det valda måttet och percentilen.
Min, Genomsnittlig, 50:e, 90:e, 95:e, Max Sammanslagning av den genomsnittliga cpu-millicore- eller minnesprestandan för containern för den valda percentilen. Det genomsnittliga värdet mäts från den cpu-/minnesgräns som angetts för en podd.
Behållare Totalt antal containrar för kontrollanten eller podden.
Startar Sammanslagning av antalet omstarter från containrar.
Drifttid Representerar tiden sedan en container startades.
Nod Endast för containrar och poddar. Den visar vilken kontrollant den finns i.
Trend min %, genomsnittlig %, 50:e %, 90:e %, 95:e %, max % Stapeldiagramtrenden representerar kontrollantens genomsnittliga percentilmått.

Fliken Container

På fliken Containrar kan du visa prestandahälsan för dina containrar.

Skärmbild som visar prestandavyn \<Name> containers.

Från en container kan du öka detaljnivån till en podd eller nod för att visa prestandadata som filtrerats för objektet. Välj värdet under kolumnen Podd eller Nod för den specifika containern.

Skärmbild som visar ett exempel på ökad detaljnivå från nod till containrar i prestandavyn.

I följande tabell beskrivs kolumnerna på fliken Containrar .

Kolumn Beskrivning
Namn Namnet på containern.
Läge Status för containern.
Min %, Genomsnittlig %, 50:e %, 90:e %, 95:e %, Max % Sammanslagningen av den genomsnittliga procentandelen av varje entitet för det valda måttet och percentilen.
Min, Genomsnittlig, 50:e, 90:e, 95:e, Max Sammanslagningen av den genomsnittliga PROCESSOR-millicore- eller minnesprestandan för containern för den valda percentilen. Det genomsnittliga värdet mäts från den cpu-/minnesgräns som angetts för en podd.
Podd Container där podden finns.
Nod  Nod där containern finns.
Startar Representerar tiden sedan en container startades.
Drifttid Representerar tiden sedan en container startades eller startades om.
Trend min %, genomsnittlig %, 50:e %, 90:e %, 95:e %, max % Stapeldiagramtrenden representerar den genomsnittliga percentilmåttprocenten för containern.

Nästa steg

  • Se Skapa prestandaaviseringar med containerinsikter för att lära dig hur du skapar aviseringar för hög processor- och minnesanvändning för att stödja dina DevOps- eller driftprocesser och procedurer.
  • Se Exempel på loggfrågor för att se fördefinierade frågor och exempel för att utvärdera eller anpassa för att avisera, visualisera eller analysera dina kluster.