Delen via


Prestatiekenmerken van blob-inventaris

Azure Storage-blob-inventaris is een essentieel hulpprogramma voor het beheren en bijhouden van de objecten die zijn opgeslagen in uw Azure Blob Storage-account. Het biedt een uitgebreid overzicht van uw opslagbronnen, zodat u weloverwogen beslissingen kunt nemen over gegevensbeheer en kostenoptimalisatie.

Nadat u blob-inventarisatierapporten hebt ingeschakeld, worden objecten in uw opslagaccount periodiek gescand met behulp van de regels die zijn gedefinieerd in het voorraadbeleid. De tijd die nodig is om een inventarisrapport te genereren, is afhankelijk van verschillende factoren. Deze factoren omvatten het aantal objecten, de mapstructuur, de filters die worden toegepast via regelsubtypen, de workload van de klant in het opslagaccount, de beschikbaarheid van opslagresources en meer. Afhankelijk van deze factoren kan het in sommige gevallen meerdere dagen duren voordat alle objecten in het opslagaccount zijn verwerkt. De prestaties van de inventarisatie kunnen ook variëren tussen scans en soms ook tijdens de scan.

Factoren die invloed hebben op de prestaties van blob-inventaris

Wanneer u blob-inventaris gebruikt om een inventarisrapport te genereren, kunnen verschillende belangrijke factoren van invloed zijn op de prestaties. Als u deze factoren begrijpt, kunt u inventarisprocessen optimaliseren en efficiënt gegevensbeheer mogelijk maken.

Distributie van objecten in hiërarchische naamruimteaccounts

De distributie van objecten binnen een hiërarchisch naamruimteaccount kan de voorraadprestaties aanzienlijk beïnvloeden. Blob-inventarisatie scant één map tegelijk en voltooit die scan voordat u naar de volgende map gaat. Daarom kan een groot aantal mappen, met name met sparse objectdistributie en diepe nesting, de tijd verhogen die nodig is om het inventarisrapport te genereren.

Aantal objecten dat is verwerkt voor de inventarisregel

Het totale aantal objecten dat is gescand op basis van een voorraadregel, is een belangrijke factor in de verwerkingsprestaties. Regels die gericht zijn op een groot aantal objecten, vereisen meer tijd en resources om een inventarisrapport te genereren. Het aantal objecten dat moet worden verwerkt, neemt toe als uw voorraadregel versies, momentopnamen en voorlopig verwijderde objecten bevat. Wanneer deze subtypen bestaan in grote volumes, kunnen ze de verwerkingstijd die nodig is om het voorraadrapport te genereren, verder uitbreiden.

Indeling van het inventarisrapport exporteren

De gekozen exportindeling voor een inventarisrapport (CSV of Apache Parquet) kan de prestaties beïnvloeden. Hoewel Parquet is geoptimaliseerd voor snelle gegevensverwerking, wordt overhead geïntroduceerd die het genereren van rapporten kan vertragen in vergelijking met CSV.

Groot aantal voorlopig verwijderde objecten

Voorlopig verwijderde objecten, maar niet permanent verwijderd, worden nog steeds opgenomen in inventarisscans. Een groot volume van deze objecten kan worden toegevoegd aan de verwerkingstijd en de prestaties verminderen. Door deze factoren te overwegen, kunt u de prestaties van uw voorraaduitvoeringen verbeteren en efficiënter gegevensbeheer hebben.

Best practices voor het verbeteren van de prestaties van blob-inventaris

Efficiënt beheer van uw Azure Blob Storage is essentieel voor het behoud van optimale prestaties en kosteneffectiviteit. Hier volgen enkele aanbevolen procedures voor het verbeteren van de prestaties van azure Storage-blobinventaris:

Vermijd sparse-accounts in hiërarchische accounts met naamruimte

Sparse-accounts zijn accounts die een groot aantal objecten bevatten verspreid over veel mappen. Deze mappen bevatten mogelijk of niet diep geneste structuren. Sparse-accounts resulteren in een zeer lage verhouding tussen bestanden en mappen, wat inefficiëntie kan veroorzaken bij het genereren van inventarisrapport en zelfs tot fouten kan leiden. Als u deze inefficiënties wilt beperken, moet u ervoor zorgen dat uw hiërarchische opslagaccount met naamruimte goed is ingedeeld en voorkomen dat u een sparse-distributie van objecten hebt.

CSV gebruiken voor de exportindeling

Bij het genereren van inventarisrapporten kiest u voor csv-indeling als voor uw use-case geen snelle gegevensverwerking is vereist. Parquet is een kolomopslagbestandsindeling die is geoptimaliseerd voor prestaties en een van de snelste indelingen die moeten worden gelezen voor gegevensverwerking. Een parquet-indeling kan echter de tijd die nodig is voor het genereren van rapporten verhogen vanwege de overhead, waardoor het langzamer is dan het genereren van een rapport in CSV-indeling. Als u de parquet-indeling nodig hebt om uw rapport na te verwerken, kunt u gebruikmaken van beschikbare opensource-hulpprogramma's waarmee CSV wordt geconverteerd naar parquet-indeling.

Bereik van uw voorraadregel met behulp van een voorvoegsel

Gebruik in plaats van inventaris uit te voeren voor het hele opslagaccount een filter voor het vergelijken van voorvoegsels om een inventarisrapport te genereren voor specifieke subsets van uw gegevens.

  • Inclusief voorvoegsel: dit filter is gericht op een set containers of paden binnen een container. Deze aanpak helpt het bereik van uw voorraadrapport te beperken, waardoor het proces sneller en efficiënter wordt.

  • Voorvoegsel uitsluiten: gebruik dit filter om een bepaalde subset ervan uit te sluiten. Deze benadering helpt ook het bereik van uw voorraadrapport te beperken. Zie Regelfilters voor meer informatie

Relevante velden selecteren

Pas uw inventarisrapporten aan door alleen de relevante velden te selecteren die u nodig hebt. Dit vermindert de hoeveelheid verwerkte en geëxporteerde gegevens, wat leidt tot een snellere generatie van rapporten en een eenvoudigere analyse. Zie Aangepaste schemavelden die worden ondersteund voor blob-inventaris voor meer informatie over de voorraadschemavelden

Subtype-opname: verwijderde objecten, momentopnamen en versies

Hoewel het opnemen van deze subtypen een uitgebreidere weergave van uw opslagaccount kan bieden, is het belangrijk om te beoordelen of ze essentieel zijn voor uw audit- en beheerbehoeften. Als ze niet kritiek zijn, kan het uitsluiten ervan helpen de prestaties en efficiëntie van het proces voor het genereren van rapporten te verbeteren. Als u objecten wilt identificeren die zijn verwijderd in recente voorraaduitvoeringen, vergelijkt u de blobnamen uit de huidige uitvoering met die uit een vorige uitvoering. Het verschil kan een lijst met onlangs verwijderde objecten bieden.

Abonneren op blob-inventaris gebeurtenissen

Blijf op de hoogte van door de gebruiker geïnduceerde fouten door u te abonneren op blob-inventarisgebeurtenissen. Deze proactieve aanpak helpt u om snel problemen op te lossen. Zie Abonneren op voltooide gebeurtenis van blob-inventarisbeleid voor meer informatie over het abonneren op inventarisevenementen.

Onverwachte toenames in capaciteit bewaken

Let op onverwachte pieken in de capaciteit van uw opslagaccount, omdat ze mogelijk duiden op de accumulatie van blobversies, momentopnamen of voorlopig verwijderde objecten. Door deze wijzigingen te bewaken, kunt u potentiële problemen detecteren en oplossen voordat ze van invloed zijn op de prestaties. Daarnaast kan het beheren van de levenscyclus van deze objecten onnodige opbouw voorkomen en de prestaties van blobinventaris verbeteren. Zie het overzicht van levenscyclusbeheer van Azure Blob Storage voor meer informatie over levenscyclusbeheer van blobs

Door deze aanbevolen procedures te volgen, kunt u de prestaties van uw blob-inventarisatie verbeteren, zodat uw Azure Blob Storage efficiënt en effectief kan worden beheerd.

Volgende stappen