Dela via


Metodtips för privat molnunderhåll i Azure VMware Solution

Azure VMware Solution utför regelbundet underhåll av det privata molnet. Det här underhållet omfattar säkerhetskorrigeringar, mindre och större uppdateringar av VMware-programvarustacken. Den här sidan beskriver värdövervakning, reparation och rekommenderade metodtips som hjälper till att hålla det privata molnet redo för underhåll.

Hantering av värdunderhåll och livscykel

En fördel med privata moln i Azure VMware Solution är att plattformen underhålls åt dig. Microsoft ansvarar för livscykelhantering av VMware-programvara (ESXi, vCenter Server och vSAN) och NSX-apparater. Microsoft ansvarar också för att starta nätverkskonfigurationen, som att skapa tier-0-gatewayen och aktivera routning mellan nord och syd. Du ansvarar för NSX SDN-konfigurationen: nätverkssegment, distribuerade brandväggsregler, nivå 1-gatewayer och lastbalanserare.

Anmärkning

En T0-gateway skapas och konfigureras som en del av en privat molndistribution. Alla ändringar av den logiska routern eller de virtuella NSX-gränsnoderna kan påverka anslutningen till ditt privata moln och bör undvikas.

Microsoft ansvarar för att tillämpa eventuella korrigeringar, uppdateringar eller uppgraderingar på ESXi, vCenter Server, vSAN och NSX i ditt privata moln. Effekten av korrigeringar, uppdateringar och uppgraderingar på ESXi, vCenter Server och NSX har följande överväganden:

  • ESXi – Det påverkar inte arbetsbelastningar som körs i ditt privata moln. Åtkomst till vCenter Server och NSX blockeras inte under den här tiden. Under den här tiden rekommenderar vi att du inte planerar andra aktiviteter som att skala upp privata moln, schemalägga eller initiera aktiva HCX-migreringar, göra HCX-konfigurationsändringar och så vidare i ditt privata moln.

  • vCenter Server – Det påverkar inte arbetsbelastningar som körs i ditt privata moln. Under den här tiden är vCenter Server inte tillgänglig och du kan inte hantera virtuella datorer (stoppa, starta, skapa eller ta bort). Vi rekommenderar att du inte planerar andra aktiviteter som att skala upp privata moln, skapa nya nätverk och så vidare i ditt privata moln. När du använder användargränssnitten för VMware Site Recovery Manager eller vSphere Replication rekommenderar vi att du inte utför någon av åtgärderna: konfigurera vSphere Replication och konfigurera eller köra platsåterställningsplaner under vCenter Server-uppgraderingen.

  • NSX – Arbetsbelastningen påverkas. När en viss värd uppgraderas kan de virtuella datorerna på den värden förlora anslutningen från 2 sekunder till 1 minut med något av följande symtom:

    • Pingfelmeddelanden

    • Paketförlust

    • Felmeddelanden (till exempel Destination Host Oåtkomlig och Nätverk oåtkomligt)

    Under det här uppgraderingsfönstret blockeras all åtkomst till NSX-hanteringsplanet. Du kan inte göra konfigurationsändringar i NSX-miljön under hela tiden. Dina arbetsbelastningar fortsätter att köras som vanligt, med förbehåll för den uppgraderingspåverkan som tidigare beskrivits.

    Under uppgraderingstiden rekommenderar vi att du inte planerar andra aktiviteter som att skala upp privata moln och så vidare i ditt privata moln. Andra aktiviteter kan förhindra att uppgraderingen startas eller kan ha negativa effekter på uppgraderingen och miljön.

Du meddelas via Azure Service Health som innehåller tidslinjen för uppgraderingen. Det här meddelandet innehåller också information om den uppgraderade komponenten, dess effekt på arbetsbelastningar, åtkomst till privata moln och andra Azure-tjänster. Du kan schemalägga om en uppgradering efter behov.

Programuppdateringar omfattar:

  • Korrigeringar – Säkerhetskorrigeringar eller felkorrigeringar som släppts av VMware

  • Uppdateringar – Delversionsändring av en VMware-stackkomponent

  • Uppgraderingar – Större versionsändring av en VMware-stackkomponent

Anmärkning

Microsoft testar en kritisk säkerhetskorrigering så snart den blir tillgänglig från VMware.

Dokumenterade VMware-lösningar implementeras i stället för att installera en motsvarande korrigering tills nästa schemalagda uppdateringar distribueras.

Värdövervakning och åtgärder

Azure VMware Solution övervakar kontinuerligt hälsotillståndet för både VMware-komponenterna och underlägget. När Azure VMware Solution upptäcker ett fel vidtar den åtgärder för att reparera de misslyckade komponenterna. När Azure VMware Solution identifierar en försämring eller ett fel på en Azure VMware Solution-nod utlöser den värdreparationsprocessen.

Värdreparation innebär att ersätta den felaktiga noden med en ny felfri nod i klustret. När det är möjligt sätts den felaktiga värden sedan i underhållsläget i VMware vSphere. VMware vSphere vMotion flyttar de virtuella datorerna från den felaktiga värden till andra tillgängliga servrar i klustret, vilket kan ge noll stilleståndstid för direktmigrering av arbetsbelastningar. Om den felaktiga värd inte kan placeras i underhållsläge tas värden bort från klustret. Innan den defekta värden tas bort migreras kundens arbetsbelastningar till en ny tillagd värd.

Tips/Råd

Kundkommunikation: Ett e-postmeddelande skickas till kundens e-postadress innan ersättningen initieras och igen efter att ersättningen har slutförts.

Om du vill ta emot e-postmeddelanden som rör ersättning av värdar måste du läggas till i någon av följande RBAC-roller (Azure Role-Based Access Control) i prenumerationen: "ServiceAdmin", "CoAdmin", "Owner", "Contributor".

Azure VMware Solution övervakar följande förhållanden på värden:

  • Processorstatus
  • Minnesstatus
  • Anslutnings- och energitillstånd
  • Maskinvarufläktstatus
  • Förlust av nätverksanslutning
  • Systemkortstatus för maskinvara
  • Fel inträffade på en eller flera diskar av en vSAN-värd
  • Maskinvaruspänning
  • Status för maskinvarutemperatur
  • Maskinvarans strömstatus
  • Lagringsstatus
  • Anslutningen misslyckades

Metodtips för underhållsåtgärder

Följande åtgärder rekommenderas alltid för att säkerställa att värdunderhållsåtgärder utförs korrekt:

  • vSAN-lagringsanvändning: För att upprätthålla serviceavtal (SLA) kontrollerar du att vSphere-klustrets lagringsutrymmesanvändning förblir under 75%. Om användningen överskrider 75%kan uppgraderingar ta längre tid än förväntat eller misslyckas helt. Om lagringsanvändningen överskrider 75%kan du överväga att lägga till en nod för att expandera klustret och förhindra potentiell stilleståndstid under uppgraderingar.
  • DRS-regler (Distributed Resource Scheduler): DRS VM-VM anti-affinitetsregler måste konfigureras så att det finns minst (N+1) värdar i klustret, där N är antalet virtuella maskiner som ingår i DRS-regeln.
  • Fel vid tolerans (FTT)-överträdelse: För att förhindra dataförlust ändrar du virtuella datorer som konfigurerats med en vSAN-lagringsprincip för fel som tolereras (FTT) på 0 till en vSAN-lagringsprincip som är kompatibel med Microsoft SLA (FTT=1 för upp till fem värdar i ett kluster och FTT=2 för sex eller fler värdar i ett kluster) och säkerställer att värdunderhållsåtgärder kan utföras smidigt.
  • Ta bort VM CD-ROM-monteringar: Virtuella datorer monterade med "Emuleringsläge" CD-ROMs blockerar värdunderhåll. Se till att CD-ROMs är monterade i "pass through-läge".
  • Seriell/parallell port eller extern enhet: Om du använder en bildfil (ISO, FLP osv.) kontrollerar du att den är tillgänglig från alla ESXi-värdar i klustret. Lagra filerna i ett datalager som delas mellan alla ESXi-servrar som deltar i vMotion för den virtuella datorn. Mer information finns i artikeln Broadcom KB.
  • Överblivna virtuella datorer: När det gäller en överbliven virtuell dator måste den virtuella datorn (VM) antingen registreras på nytt om möjligt (om den inte har tagits bort) eller tas bort från lagret. Mer information finns i artikeln Broadcom KB.
  • DELAD SCSI-styrenhet: När du använder SCSI-bussdelning, använd busstypen "Fysisk" för virtuella maskiner. Virtuella datorer som är anslutna till virtuella SCSCI-styrenheter stängs av. Mer information finns i artikeln Broadcom KB.
  • Virtuella datorer från tredje part och program: För virtuella datorer från tredje part och program:
    • Se till att lösningar från tredje part som distribueras i Azure VMware Solution är kompatibla och inte stör underhållsåtgärderna.
    • Kontrollera att den virtuella datorn inte är installerad med en VM-Host DRS-regel "Måste köras". Kontrollera dessutom att dessa program är kompatibla med kommande versioner av VMware-stacken.
    • Kontakta lösningsleverantören och uppdatera i förväg om det behövs för att upprätthålla kompatibiliteten efter uppgraderingen.

Aviseringskoder och reparationstabell

Felkod Felinformation Rekommenderad åtgärd
CD-ROM Emuleringsläge Det här felet uppstår när CD-ROM på den virtuella datorn använder emuleringsläge, vars ISO-avbildning inte är tillgänglig Följ den här KB-artikeln för borttagning av cdrom som monterats på kundens arbetsbelastning virtuella datorer i emuleringsläge eller koppla från ISO. Vi rekommenderar att du använder "pass-through-läge" för montering av CD-ROM-enheter.
EPC_DRSOVERRIDERULE Det här felet påträffas när det finns en virtuell dator med DRS-åsidosättning inställd på läget "Inaktiverad". De virtuella maskinerna bör inte blockera vMotion när värden försätts i underhållsläge. Ange delvis automatiserade DRS-regler för den virtuella datorn. Mer information om placeringsprinciper för virtuella datorer finns i det här dokumentet .
EPC_SCSIDEVICE_SHARINGMODE Det här felet uppstår när en virtuell dator har konfigurerats för att använda en enhet som förhindrar en underhållsåtgärd: En enhet som är en SCSI-styrenhet som är engagerad i bussdelning Följ den här KB-artikeln för att ta bort alla SCSI-styrenheter som arbetar med bussdelning som är kopplade till virtuella datorer.
EPC_DATASTORE_OTILLGÄNGLIG Det här felet uppstår när ett externt datalager som är kopplat till DET privata AVS-molnet blir otillgängligt Följ den här artikeln om du vill ta bort alla inaktuella datalager som är anslutna till klustret
EPC_NWADAPTER_STALE Det här felet uppstår när det anslutna nätverksgränssnittet på den virtuella datorn använder nätverkskort, vilket blir otillgängligt Följ den här KB-artikeln om du vill ta bort inaktuella N/W-kort som är anslutna till virtuella datorer.
EPC_Serialport Det här felet uppstår när en virtuell maskins serieport är ansluten till en enhet som inte kan nås på måldatorn. Om du använder en avbildningsfil (ISO, FLP och så vidare) kontrollerar du att den är tillgänglig från alla ESXi-servrar i klustret. Lagra filerna i ett datalager som delas mellan alla ESXi-servrar som deltar i vMotion för den virtuella datorn. Mer information finns i den här KB-artikeln från Broadcom.
EPC_HARDVARUENHET Det här felet uppstår när en virtuell dators parallella port/USB-enhet är ansluten till en enhet som inte kan nås på destinationvärden. Om du använder en avbildningsfil (ISO, FLP och så vidare) kontrollerar du att den är tillgänglig från alla ESXi-servrar i klustret. Lagra filerna i ett datalager som delas mellan alla ESXi-servrar som deltar i vMotion för den virtuella datorn. Mer information finns i den här KB-artikeln från Broadcom.
EPC_OGILTIGVM/EPC_FÖRÄLDRALÖSVM Det här felet uppstår när det finns en överbliven eller ogiltig virtuell dator i inventeringen Se till att alla dina virtuella datorer är tillgängliga för vCenter. Mer information finns i den här KB-artikeln .
EPC_VMHOSTDRSRULE Det här felet uppstår när det finns en virtuell dator med drs-regeln för värdtillhörighet/antitillhörighet. Den virtuella datorn bör inte blockera VMware vMotion när en värd sätts i underhållsläge. Ange "ska-krav" för VM-Host affinitet. Mer information finns i det här dokumentet .
EPC_FTT_ZERO Det här felet uppstår när en virtuell dator har "Tolererade fel" som 0 eller "Ingen dataredundans". Följ den här KB-artikeln om du vill konfigurera FTT som 1 eller 2 för den virtuella datorn.
EPC_FTTVIOLATION Det här felet uppstår när ett kluster inte har det minsta antal värdar som lagringsprincipen behöver. Lägg till värdar enligt kraven i lagringspolicyn eller ändra VM FTT-policy för att stödja att sätta värden i underhållsläge. Läs den här KB-artikeln om du vill veta mer om FTT-principen.

Anmärkning

Klientadministratörer för Azure VMware Solution får inte redigera eller ta bort de tidigare definierade VMware vCenter Server-larmen eftersom de hanteras av kontrollplanet för Azure VMware Solution på vCenter Server. Dessa larm används av Azure VMware Solution-övervakning för att utlösa Azure VMware Solution-värdreparationsprocessen.

Nästa steg

Nu när du har gått igenom metodtipsen för underhåll av privata moln i Azure VMware Solution kanske du vill lära dig mer om: