Dela via


Prestandaegenskaper för blobinventering

Azure Storage Blob Inventory är ett viktigt verktyg för att hantera och spåra objekt som lagras i ditt Azure Blob Storage-konto. Den ger en omfattande översikt över dina lagringsresurser så att du kan fatta välgrundade beslut om datahantering och kostnadsoptimering.

När du har aktiverat blobinventeringsrapporter genomsöks objekt i ditt lagringskonto regelbundet med hjälp av de regler som definieras i inventeringsprincipen. Hur mycket tid det tar att generera en inventeringsrapport beror på flera faktorer. Dessa faktorer inkluderar antalet objekt, katalogstrukturen, filtren som tillämpas via regelundertyper, kundens arbetsbelastning på lagringskontot, tillgängligheten för lagringsresurser med mera. I vissa fall kan det, beroende på dessa faktorer, ta flera dagar att slutföra bearbetningen av alla objekt i lagringskontot. Inventeringens prestanda kan också variera mellan genomsökningar och ibland även under genomsökningen.

Faktorer som påverkar blobinventeringsprestanda

När du använder blobinventering för att generera en inventeringsrapport kan flera viktiga faktorer påverka dess prestanda. Att förstå dessa faktorer kan hjälpa dig att optimera inventeringsprocesser och möjliggöra effektiv datahantering.

Distribution av objekt i hierarkiska namnområdesaktiverade konton

Fördelningen av objekt i ett hierarkiskt namnområdesaktiverat konto kan avsevärt påverka inventeringsprestandan. Blobinventeringen söker igenom en katalog i taget och slutför genomsökningen innan den flyttas till nästa katalog. Därför kan ett stort antal kataloger, särskilt med gles objektdistribution och djup kapsling, öka den tid som krävs för att generera inventeringsrapporten.

Antal objekt som bearbetats för inventeringsregeln

Det totala antalet objekt som genomsöks baserat på en inventeringsregel är en nyckelfaktor för bearbetningsprestanda. Regler som riktar sig mot en stor mängd objekt kräver mer tid och resurser för att generera en inventeringsrapport. Antalet objekt som ska bearbetas ökar om inventeringsregeln innehåller versioner, ögonblicksbilder och mjukt borttagna objekt. När dessa undertyper finns i stora volymer kan de ytterligare utöka bearbetningstiden som behövs för att generera inventeringsrapporten.

Exportformat för inventeringsrapporten

Det valda exportformatet för en inventeringsrapport (CSV eller Apache Parquet) kan påverka prestanda. Parquet är optimerat för snabb databearbetning, men det medför kostnader som kan göra rapportgenereringen långsammare jämfört med CSV.

Stort antal mjukt borttagna objekt

Mjukt borttagna objekt, men tas inte bort permanent, ingår fortfarande i inventeringsgenomsökningar. En stor mängd av dessa objekt kan öka bearbetningstiden och minska prestandan. Genom att ta hänsyn till dessa faktorer kan du förbättra prestandan för dina inventeringskörningar och få en mer effektiv datahanteringsupplevelse.

Metodtips för att förbättra blobinventeringsprestanda

Det är viktigt att effektivt hantera Azure Blob Storage för att upprätthålla optimal prestanda och kostnadseffektivitet. Här följer några metodtips för att förbättra prestanda för Azure Storage-blobinventering:

Undvik glesa konton i hierarkiska namnområdesaktiverade konton

Glesa konton är de som innehåller ett stort antal objekt spridda över många kataloger. Dessa kataloger kanske eller kanske inte innehåller djupt kapslade strukturer. Sparse-konton resulterar i ett mycket lågt fil-till-katalog-förhållande, vilket kan orsaka ineffektivitet i lagerrapportgenereringen och till och med leda till fel. För att minska dessa ineffektiviteter kontrollerar du att ditt hierarkiska namnområdesaktiverade lagringskonto är välorganiserat och undviker att ha en gles fördelning av objekt.

Använda CSV för exportformatet

När du genererar inventeringsrapporter väljer du csv-format om ditt användningsfall inte kräver snabb databearbetning. Parquet är ett kolumnformat för lagringsfiler som är optimerat för prestanda och ett av de snabbaste formaten att läsa för databearbetning. Ett parquet-format kan dock öka den tid som krävs för att generera rapporter på grund av dess omkostnader, vilket gör det långsammare än att generera en rapport i csv-format. Om du behöver parquet-formatet för att efterbearbeta rapporten kan du använda tillgängliga verktyg med öppen källkod som konverterar CSV till parquet-format.

Omfång för inventeringsregeln med hjälp av ett prefix

I stället för att köra inventering på hela lagringskontot använder du ett prefixmatchningsfilter för att generera en inventeringsrapport för specifika delmängder av dina data.

  • Inkludera prefix: Det här filtret riktar sig mot en uppsättning containrar eller sökvägar i en container. Med den här metoden kan du begränsa inventeringsrapportens omfattning, vilket gör processen snabbare och effektivare.

  • Exkludera prefix: Använd det här filtret om du vill undanta vissa specifika delmängder från det. Den här metoden hjälper också till att begränsa omfattningen för din inventeringsrapport. Mer information finns i Regelfilter

Välj relevanta fält

Anpassa dina inventeringsrapporter genom att bara välja de relevanta fält du behöver. Detta minskar mängden data som bearbetas och exporteras, vilket leder till snabbare rapportgenerering och enklare analys. Mer information om inventeringsschemafälten finns i Anpassade schemafält som stöds för blobinventering

Inkludering av undertyper: borttagna objekt, ögonblicksbilder och versioner

Även om dessa undertyper kan ge en mer omfattande vy över ditt lagringskonto är det viktigt att utvärdera om de är nödvändiga för dina gransknings- och hanteringsbehov. Om de inte är kritiska kan exkludering av dem hjälpa till att förbättra prestanda och effektivitet för din rapportgenereringsprocess. Om du vill identifiera objekt som tagits bort i de senaste inventeringskörningarna jämför du blobnamnen från den aktuella körningen med dem från en tidigare körning. Skillnaden kan ge en lista över nyligen borttagna objekt.

Prenumerera på blobinventeringshändelser

Håll dig informerad om användarinducerade fel genom att prenumerera på blobinventeringshändelser. Den här proaktiva metoden hjälper dig att snabbt åtgärda problem. Mer information om hur du prenumererar på inventeringshändelser finns i Prenumerera på blobinventeringsprincipen slutförd händelse.

Övervaka oväntade ökningar av kapaciteten

Var uppmärksam på oväntade toppar i lagringskontots kapacitet, eftersom de kan signalera ackumulering av blobversioner, ögonblicksbilder eller mjukt borttagna objekt. Övervakning av dessa ändringar kan hjälpa dig att identifiera och lösa potentiella problem innan de påverkar prestanda. Dessutom kan hantering av livscykeln för dessa objekt förhindra onödig uppbyggnad och förbättra blobinventeringsprestanda. Mer information om hantering av bloblivscykel finns i Översikt över livscykelhantering i Azure Blob Storage

Genom att följa dessa metodtips kan du förbättra prestandan för din blobinventering, vilket säkerställer effektiv och effektiv hantering av Azure Blob Storage.

Nästa steg